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实践 经 验 ， 并 结合 实际 代码 、 图 示 、 案 例 等 讲解 了 人 工 智 能 的 基本 知识 。 

全 书 共 分 10 章 ， 主 要 内 容 包括 : 基于 规则 的 专家 系统 、 不 确定 性 管理 技术 、 和 模糊 专家 系 
统 、 基 于 框 染 的 专家 系统 、 人 工 神 经 网 络 、 进 化 计算 、 混 合 智能 系统 、 知 识 工 程 、 数 据 挖掘 
等 。 必 外 ,本 书 还 提供 了 一 个 人 工 智 能 相关 术语 表 和 包含 商业 化 的 人 工 知 能 工具 的 附录 。 

本 书 既 可 以 作为 计算 机 科学 相关 专业 本 科 生 的 人 门 教材 ， 也 可 以 作为 非 计算 机 科学 专业 
该 者 的 目 学 参考 书 。 
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ATRE (Artificial Intelligence, AI) EEMMERI —P 456, BU Aye 21 世纪 三 大 尖端 
技术 《基因 工程 、 纳 米 科 学 、 人 工 智 能 ) 之 一 。“ 人 工 知 能 ”一 词 最 初 是 在 1956 APR Re pe 
院 人 研讨 会 上 提出 的 。 从 那 以 后 ， 研 究 者 们 发 展 了 众多 理论 和 原理 ， 人 工 智 能 的 概念 也 随 之 扩展 。 
在 经 历 了 辉煌 和 低谷 之 后 ， 近 30 年 来 ， 人工 智能 的 研究 取得 了 迅速 的 发 展 ， 在 很 多 领域 〈 例 如 
工程 、 医 疗 、 财 经 、 商 业 和 管理 等 ) 部 获得 了 广泛 应 用 。 人 工 吞 能 的 人 研究 逐渐 成 熟 ， 已 成 为 一 
个 独立 的 分 文 ， 无 论 在 理论 和 实践 上 都 已 目 成 一 个 系统 。 

本 书 作者 Michael Negnevitsky 是 澳大利亚 挫 斯 马 尼 亚 大 学 电气 工程 和 计算 机 科学 系 教授 。 他 
的 许多 研究 读 题 都 涉及 人 工 智 能 和 软 计算 ， 一 直 致 力 于 电气 工程 、 过 程控 制 和 环境 工程 中 智能 
系统 的 开发 和 应 用 。 他 若 有 200 多 篇 论文 、 两 本 书 ， 并 获得 了 四 项 发 明 专 利 。 

Ak Bk ARAEISLACLU SEAT ITHSER, PARERE. DAE. xh wm . eB. WEB]. HA 
等 多 所 大 学 的 计算 机 相关 专业 都 采用 本 书 作 为 教材 或 主要 教学 参考 书 。 与 第 2 版 相 比 ， 第 3 版 引 
入 了 关于 “数据 挫 据 ”的 新 的 一 曹 ， 并 展示 了 智能 工具 在 解决 复杂 实际 问题 中 的 新 应 用 。 第 3 
版 还 扩展 了 本 书 的 参考 文献 和 参考 书目 ， 并 更 新 了 附录 中 的 人 工 乔 能 工具 和 上 广 商 列 表 。 通 过 本 
书 的 学 习 ， 相 信 读 者 一 定 会 对 人 工 智 能 的 完整 知识 体系 有 全 面 的 了 解 。 

陈 入 组 织 并 参与 了 本 书 的 翻译 和 审 校 工作 ， 参 加 翻 幸 工 作 的 还 有 辣 秋 玲 、 黄 威 靖 、 欧 局 炎 、 
MUR LPP IOP ER, PESO Bit PIU Be ZAP EES, 欢迎 广 大 读者 批评 指正 。 















































陈 和 鹤 
2012 年 于 北京 大 学 
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这 本 书 的 主要 目的 与 第 1 版 相同 ， 即 为 谈 者 提供 一 本 能 实际 了 解 计算 机 智能 领域 相关 知识 的 
书 。 它 适合 作为 一 个 学 期 诛 程 的 入门 教程 ， 学 生 需 要 具备 一 些微 积分 的 知识 ， 不 要 求 具 备 编程 的 

在 涵盖 内 容 方 面 ， 本 书 引 入 了 关于 数据 挖掘 的 新 的 一 革 ， 并 展示 了 管 能 工具 在 解决 复杂 实 
际 问 题 中 的 新 应 用 。 主 要 的 变化 如 下 : 

在 新 的 “数据 控 据 和 知识 发 现 ” 一 章 中 ， 我 们 介绍 了 大 型 数据 库 中 知识 发 现 不 可 或 缺 的 一 
部 分 一 一 数据 控 据 。 涉 及 将 数据 转换 为 知识 的 主要 技术 和 工具 ,包括 统计 方法 、 数 据 可 视 化 工 
具 、 结 构 化 查询 语言 、 决 人 条 树 和 购物 篮 分 析 。 同 时 还 展示 了 儿 个 数据 挖掘 应 用 的 实例 。 

在 第 9 章 中 ， 增 加 了 采用 目 组 织 神经 网 络 进行 聚 类 分 析 的 新 的 实例 。 

最 后 ， 我 们 还 扩展 了 本 书 的 参考 文献 和 参考 书目 ， 更 新 了 附录 中 的 人 工 智能 工具 和 广 rn 
列表 。 
































Michael Negnevitsky 
2010 年 9 月 于 澳大利亚 
塔 斯 马 尼 亚 州 “ 堆 巴 特 市 
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“The only way not to succeed is not to try. ” 
— Edward Teller 

又 是 一 本 人 工 智 能 的 书 …… 我 已 经 见 过 很 多 同类 的 书 ， 为 什么 还 要 理会 它 ?” 它 有 什么 与 众 
不 同 之 处 ? 

每 年 ， 有 成 百 上 和 干 本 书 和 博士 论文 拓展 着 计算 机 或 人 工 智 能 的 知识 体系 。 专 家 系统 、 人 工 神 
经 网 络 、 模 糊 系统 以 及 进化 计算 是 应 用 于 智能 系统 的 主要 技术 ， 数 百 个 工具 支持 着 这 些 技术 ， 数 
以 千 计 的 科学 论文 不 断 推 进 厦 该 学 科 的 发 展 。 本 书 中 的 任何 章节 的 内 容 都 可 以 作为 一 本 书 的 主 
题 。 然 而 ， 我 想 写 一 本 能 够 阐述 智能 系统 基础 的 书 ， 更 为 重要 的 原因 是 ,我 想 消 除 大 家 对 人 工 管 
能 理论 的 长 惧 心 理 。 

大 多 数 人 工 智 能 文献 是 采用 计算 机 科 和 苑 的 专业 术语 进行 描述 的 ， 其 中 充斥 春 大 量 复 杂 的 拖 
阵 代数 和 微分 方程 ， 这 当然 给 人 工 留 能 理论 市 来 了 令 人 馈 佩 的 资本 ,但 同时 也 令 非 计算 机 科学 
的 科学 家 对 其 敬而远之 。 不 过 ， 这 种 情况 已 经 有 所 改变 ! 

个 人 电脑 已 经 成 为 我 们 日 芝 生 活 中 不 可 或 缺 的 部 分 ， 我 们 将 它 用 于 打字 机 和 计算 项、 日 历 
和 通信 和 系统、 交互 式 数 据 库 以 及 决 委 支持 系统 。 并 且 我 们 还 淘 望 更 多 。 我 们 希望 计算 机 智能 化 1 
我 们 发 现 智能 系统 正 快速 地 走出 实验 室 ， 而 我 们 也 想 更 好 地 利用 它 。 

智能 系统 的 原理 是 什么 ? 它 是 如 何 构 建 的 ? 智能 系统 的 用 人 处 是 什么 ? 我们 该 如 何 选择 适当 的 
工具 构建 智能 系统 ? 这 些 问 题 都 可 以 在 本 书 中 找到 答案 。 

与 许多 介绍 计算 机 智能 的 书 不 同 ， 本 书 将 智能 系统 育 后 的 奥妙 简单 明了 地 展示 给 读者 。 它 
是 基于 作者 多 年 来 给 没有 多 少 微 积分 知识 的 学 生 授课 时 所 用 的 讲义 而 编写 的 ， 读 者 甚至 不 用 学 
习 任 何 编程 语言 就 可 轻松 理解 ! 书 中 的 素材 已 经 经 过 笔者 15 年 的 教学 实践 的 检验 ， 写 作 中 也 考 
虑 了 学 生 们 提出 的 典型 问题 和 建议 。 

本 书 是 一 本 计算 机 智能 领域 的 入门 书籍 ， 内 容 包括 基于 规则 的 专家 系统 、 模 糊 专 家 系统 、 基 
于 框 染 的 专家 系统 、 人 工 神 经 网 络 、 进 化 计算 、 混 合 贸 能 系统 、 知 识 工 程 和 数据 挖掘 。 

总 体 来 说 ， 本 书 可 作为 计算 机 科学 、 计 算 机 信息 系统 和 工程 专业 的 本 科 生 的 和 人 门 教材 。 我 在 
教学 过 程 中 ,会 要 求学 生 开 发 小 型 的 基于 规则 和 基于 框架 的 专家 系统 ， 设 计 一 个 模糊 系统 ， 探 究 
人 工 神 经 网 络 ， 采 用 遗传 算法 求解 一 个 简单 的 优化 问题 ， 并 开发 混合 的 神经 模糊 系统 。 他 们 使 用 
一 些 专家 系统 的 核心 程序 (XpertRule Exsys Corvid 和 Visual Rule Studio), MATLAB 的 模糊 逻辑 
工具 箱 以 及 MATLAB 的 神经 网 络 工 具 箱 。 我 们 选择 这 些 工 具 的 原因 是 它们 能 够 便利 地 演示 教学 
中 的 原理 。 然 而 ， 本 书 并 不 局 限于 任何 特定 的 工具 ， 书 中 给 出 的 例子 可 以 轻松 地 在 不 同 的 工具 中 
实现 。 ww ai bbt. com TOOOOO00 

本 书 也 适合 非 计 算 机 科学 专业 的 相关 人 士 上 自学。 对 于 他 们 来 次 ,本 书 提 供 了 进入 基于 知识 
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的 系统 和 计算 智能 的 前 沿 领 域 的 钥 是 。 事 实 上 ， 本 书面 向 的 专业 谈 者 群 十 分 广泛 : 工程 师 和 科学 
家 、 管 理 人 员 和 商人 人、 医生 和 律师 ， 也 就 是 所 有 面临 挑战 而 无 法 用 传统 的 方法 解决 问题 的 人 ， 所 
有 想 了 解 计算 机 乔 能 领域 巨大 成 就 的 人 。 本 书 将 帮助 你 实际 了 解 智能 系统 的 用 途 ， 发 现 与 你 的 
工作 密切 相关 的 工具 ， 并 最 终 学 会 如 何 使 用 这 些 工 具 。 

希望 读者 能 与 我 共同 分 享 人 工 智 能 和 软 计算 学 科 所 寓 来 的 乐趣 ， 并 从 本 书 中 获 益 。 

读者 可 以 访问 http://www. booksites. net/negnevitsky 获得 更 多 的 信息 。 

















Michael Negnevitsky 
2001 4-2 月 于 澳大利亚 
塔 斯 马 尼 亚 州 tee 
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本 书 一 共 包 含 10 3$, 

第 1 草 简要 介绍 了 人 工 智 能 的 历史 ， 从 20 世纪 中 期 诞生 人 工 知 能 的 思想 并 在 60 年 代 设 立 了 
远大 目标 并 积极 实现 到 20 世纪 70 年 代 早 期 理想 破 火 和 资金 投入 大 幅 曾 减 ; 从 20 世纪 70 年 代 第 
一 代 专 家 系统 (DENDRAL, MYCIN, PROSPECTOR) 的 诞生 到 20 世纪 八 九 十 年 代 专 家 系统 技术 
的 成 束 和 其 在 不 同 领域 的 广泛 应 用 ; 从 20 世纪 40 年 代 简 单 的 二 元 神经 元 模型 的 提出 到 20 世纪 
80 年 代 人 工 神经 网 络 领域 的 复苏 ; 从 20 世纪 60 年 代 柑 糊 集 理论 的 提出 和 它 的 存在 锌 西方 忽视 
到 20 世纪 80 年 代 日 本 生产 出 大 量 模糊 用 户 产 品 ， 以 及 20 世纪 90 年 代 软 计算 和 文字 计算 在 世界 
汇 围 内 的 广泛 接受 。 

第 2 章 提 供 了 基于 规则 的 专家 系统 概述 。 作 者 简要 介绍 了 知识 的 概念 ， 以 及 专家 用 产生 式 规 
则 表示 知识 的 过 程 。 作 者 介绍 了 专家 系统 开发 团队 的 主要 成 员 和 基于 规则 系统 的 结构 。 分 析 了 
专家 系统 的 基本 特性 ， 并 指出 专家 系统 不 是 万 无 一 失 的 。 然 后 回顾 了 前 回 链 接 和 后 加 链接 推理 
技术 ， 并 讨论 了 冲突 消解 保 略 。 最 后 分 析 了 基于 规则 的 专家 系统 的 优 缺 点 。 

第 3 章 展 示 了 专家 系统 使 用 的 两 种 不 确定 性 管理 技术 : 贝 叶 斯 推理 和 确信 因子 。 作 者 分 析 了 
不 确定 知识 的 主要 来 源 ， 并 和 傈 要 回顾 了 概率 理论 。 作 者 考 愿 了 可 累积 论据 的 贝 叶 斯 方法 并 开发 
一 个 简单 的 基于 贝 叶 斯 方法 的 专家 系统 。 然 后 讨论 确信 因 了 于 理论 〈 贝 叶 斯 推理 的 第 用 符 代 方 
法 )， 并 开发 一 个 基于 论据 推理 的 专家 系统 。 最 后 ， 比 较 贝 叶 斯 推理 和 确信 因子 理论 并 分 析 它 们 
的 适用 范围 。 

第 4 半 介 绍 了 模糊 逻辑 并 讨论 其 背后 的 哲学 思想 。 首 先 介绍 模糊 集 的 概念 ， 考 虑 如 何在 计算 
机 里 表示 一 个 模糊 集 并 介绍 了 模糊 集 的 操作 。 作 者 还 定义 了 语言 变量 和 模糊 限制 语 (hedge). 2^ 
后 作者 叙述 了 模糊 规则 ， 并 解释 了 经 典 规则 和 模糊 规则 的 主要 区 别 。 该 章 主 要 人 研 完 两 种 模糊 推 
理 技术 : Mamdani 法 和 Sugeno 法 ， 并 就 它们 适宜 的 应 用 领域 给 出 建议 。 最 后 介绍 开发 一 个 模糊 
专家 系统 的 主要 步 召 ， 并 通过 构建 和 调试 模糊 系统 的 具体 过 程 来 阐明 其 理论 。 

第 5 章 概述 了 基于 框 漆 的 专家 系统 。 介 绍 了 框 以 的 概念 ， 并 讨论 如 何 将 框 漆 用 于 知识 表达 ， 
以 及 阐明 继承 是 基于 框 染 系统 的 基本 特征 ， 还 讨论 了 了 方法、 守护 程 序 和 规则 的 应 用 。 最 后 通过 一 
个 实例 来 介绍 基于 框 染 的 专家 系统 的 开发 。 

第 6 草 介 绍 了 人 工 神 经 网 络 ， 并 讨论 了 机 融 学 习 的 基本 思想 。 令 述 作为 一 个 简单 的 计算 单元 
的 感知 融 的 概念 ， 并 讨论 了 感知 希 的 学 习 规 则 ， 还 探索 了 多 层 神 经 网 络 ， 以 及 讨论 了 如 何 提高 反 
癌 传 播 学 习 算 法 的 计算 效率 。 然 后 介绍 循环 神经 网 络 ， 思 考 Hopfield 网 络 训练 算法 和 双向 联想 记 
忆 (BAM)。 最 后 介绍 日 组 织 神经 网 络 并 探讨 Hebbian 学 习 规 则 和 苋 争 学 习 。 

第 7 半 概 述 了 进化 计算 ， 其 中 包括 遗传 算法 、 进 化 策略 和 遗传 编程 。 首 先 介 绍 了 开发 一 个 遗 
传 算法 的 主要 步 又 ， 讨 论 遗 传 算法 的 工作 机 制 ， 并 通过 具体 的 遗传 算法 应 用 阐明 其 理论 。 然 后 叙 
述 一 个 进化 策略 的 基本 概念 ， 比 较 了 进化 策略 和 遗传 算法 之 间 的 不 同 。 最 后 考虑 遗传 编程 以 及 
它 的 实际 应 用 。 ww ai bbt. com O00000 C 

第 8 章 讨 论 了 结合 不 同 智能 技术 的 混合 智能 系统 。 首 先 介绍 一 种 新 型 的 专家 系统 
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家 系统 ， 它 将 神经 网 络 和 基于 规则 的 专家 系统 结合 起 来 。 然 后 考虑 一 个 功能 上 等 同 于 Mamdani 
模糊 推理 模型 的 神经 -模糊 系统 ， 以 及 一 个 功能 上 等 同 于 Sugeno 模糊 推理 模型 的 目 适 应 神经 模 
糊 推 理 系 统 (ANFIS ) 。 最 后 讨论 进化 神经 网 络 和 模糊 进化 系统 。 

第 9 章 讨论 了 知识 工程 。 首 先 讨 论 智能 系统 可 以 解决 什么 样 的 问题 ， 并 介绍 知识 工程 过 程 的 
6 个 主要 阶段 。 然 后 展示 了 专家 和 系统、 模糊 系统 、 神 经 网 络 和 遗传 算法 的 典型 应 用 。 作 者 演示 了 
如 何 构建 智能 系统 来 解决 诊断 、 选 择 、 预 测 、 分 类 、 聚 类 和 优化 问题 。 最 后 讨论 了 混合 神经 - 模 
糊 系 统 在 决策 支持 和 时 序 预测 方面 的 应 用 。 

第 10 半 介 绍 了 数据 挖掘 的 概貌 ， 讨 论 了 将 数据 转换 为 知识 的 主要 技术 。 自 和 完 ， 和 宽泛 地 定义 
了 数据 挖掘， 并 解释 了 在 大 型 数据 库 中 进行 数据 挖掘 和 知识 发 现 的 过 程 。 介 绍 了 一 些 统计 学 方 
法 ,包括 主 成 分 分 析 ， 并 讨论 了 它们 的 局 限 性 。 随 后 展示 了 关系 数据 库 中 结构 化 查询 语言 的 应 
用 ,介绍 了 数据 仓库 和 多 维 数据 分 析 。 最 后 ,介绍 了 最 流行 的 数据 挖掘 工具 一 一 决策 树 和 购物 篮 
分 析 。 

本 书 还 包括 一 个 术语 表 和 一 个 附录 。 术 语 表 包含 了 300 余 条 用 于 专家 系统 、 模 糊 逻 辑 、 神 经 
网 络 、 进 化 计算 、 知 识 工 程 以 及 数据 挖 气 领 域 的 定义 。 附 录 中 提供 了 商业 化 的 人 工 智 能 工具 的 
列表 。 

本 书 的 网 站 地 址 为 http://www. booksites. net/negnevitsky , 
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本 章 讨 论 何 为 智能 以 及 机 器 能 否 真 正 实现 智能 化 。 


哲学 家 们 两 千 多 年 来 一 直 致 力 于 理解 和 解决 宇宙 的 两 大 问题 : 人 类 是 如 何 思考 的 ? 人 类 以 
外 的 物体 是 否 也 能 够 思考 ? 至 今 ， 这 两 个 问题 依旧 没有 答案 。 

一 部 分 哲学 家 接受 由 计算 机 领域 的 科学 家 提出 的 计算 方法 ， 认可 人 类 所 做 的 任何 事情 机 带 
都 能 够 做 到 的 观点 。 另 一 部 分 哲学 家 则 非 稼 反对 这 一 观点 ， 认 为 一 些 高 级 复杂 的 行为 (例如 爱 、 
创新 、 道 德 判断 ) 远 超 出 了 任何 机 融 的 能 力 范 围 。 

哲学 的 特质 允许 这 些 争论 一 直 存 在 。 但 事实 上 ， 工 程 师 和 科学 家 们 已 经 造 出 了 具有 “智能 ” 
的 机 需 。 何 为 “智能 "? 下 面 是 来 目 《 柯 林 斯 基础 英语 词典 》 的 定义 : 

(1) 智能 是 人 类 理解 和 学 习 事 情 的 能 

(2) #4 思考 和 理解 事情 的 能 力 ， 而 非 本 能 或 机 械 地 做 事情 。 
《柯林斯 基础 英语 词典 》2008 年 版 
按照 第 一 条 定义 ， 知 能 是 专属 于 人 类 的 一 个 品质 ， 但 第 二 条 和 定义 更 具 弹 性 ， 指 出 只 要 具有 有 思 
考 和 理解 能 力 就 具有 智能 ， 而 不 限制 主体 是 人 还 是 物 。 而 定义 里 的 “思考 ”是 什么 意思 呢 ? 再 
次 看 词典 中 的 定义 : 

思考 是 使 用 大 脑 考虑 问题 或 创建 新 想法 的 活动 。 
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《柯林斯 基础 英语 词典 》2008 年 版 

为 了 能 够 思考 ， 人 或 物 需 要 拥有 像 大 脑 那样 的 一 个 硕 家 ， 依 赖 它 去 学 习 、 理 解 事物 ， 去 处 理 
问题 和 做 出 决策 。 因 此 智能 可 以 定义 为 “学 习 和 理解 事物 、 处 理 问题 并 做 出 决策 的 能 力 ”。 

计算 机 能 否 智 能 化 ， 即 机 种 能 否 思考 ， 这 一 问题 源 于 人 工 知 能 的 “黑暗 时 代 ” (20 世纪 40 
年 代 晚 期 开始 ) 。 作为 一 门 科学 ， 人 工 智 能 (Artificial Intelligence, AI) 的 目标 是 使 机 需 像 人 那 
样 具有 智能 去 做 事情 (Boden, 1977) 。 因 此 ， 关 于 “机 融 能 否 思考 ”这 一 问题 的 答案 对 人 工 智 
能 这 一 学 科 至 关 重 要 。 答 案 本 刁 不 是 “能 ”或 “不 能 ”之 类 的 简单 判断 ， 而 必定 是 模糊 的 。 我 
们 从 常识 中 也 能 得 出 这 个 结论 ， 比如 一 部 分 人 在 某 些 方面 比 其 他 人 聪明 ; 日 党 生活 中 做 出 的 抉 
择 有 些 是 明智 的 ， 有 些 则 很 思 硒 的; 有 人 可 能 精通 复杂 的 数学 、 工 程 问题 ， 但 对 于 哲学 或 历史 却 
— FG NI; 有 人 善于 赚钱 ， 而 有 人 更 善于 花 钱 。 虽 然 人 类 中 的 每 一 个 成 员 都 具有 和 学习 和 理解 事 
物 、 处 理 问题 并 做 出 决策 的 能 力 ， 但 比较 起 来 ， 这 种 能 力 在 每 一 个 领域 都 不 均等 。 所 以 ， 如 采 机 
休 能 够 思考 ， 一 部 分 机 需 在 某 些 方面 也 许 比 另 一 部 分 机 需 聪 明 。 

英国 数学 家 阿兰 . 图 灵 (Alan Turing) 在 50 多 年 前 撰写 的 论文 “计算 机 入 和 智能 化 ” (Tur- 
ing, 1950) 是 关于 机 需 智 能 方面 最 早 和 最 有 影响 的 文章 之 一 。 图 灵 的 思想 经 住 了 时 间 的 考验 ， 
到 现在 为 止 仍 是 通用 的 。 

阿兰 . 图 灵 在 20 世纪 30 年 代 早 期 重新 发 现 了 中 心 极 限定 理 ， 他 也 由 此 开始 了 科学 生涯 。 
1937 年 ， 他 发 表 了 可 计算 数字 的 论文 ,在 这 篇 文 草 中 提出 了 通用 机 融 的 概念 。 之 后 在 二 战 期 间 ， 
他 在 破解 德国 军用 编码 机 Enigma 的 工作 中 担任 了 重要 角色 。 第 二 次 世界 大 战 结束 后 ， 他 设计 了 
“ 目 动 计算 机 各 ”， 并 设计 了 第 一 个 国际 象棋 比 络 程序 ， 后 来 在 曼彻斯特 大 学 的 计算 机 上 得 以 实 
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现 。 图 灵 关 于 通用 机 的 理论 概念 和 详 码 的 实践 经 验 使 他 在 人 工 智 能 的 关键 性 基础 问题 方面 取得 
进展 。 他 曾经 提出 这 样 的 问题 : 是 否 存 在 不 需 经 验 的 思考 ?” 是 否 人 存在 不 需 交 流 的 思考 ? 是 否 存在 
不 使 用 的 语言 ? 是 否 存在 生命 之 外 的 智能 ? 显然 ,这些 问题 都 是 人 工 秋 能 中 的 基础 问题 一 一 
“机 机 能 否 思考 ?” 的 不 同 表达 。 

图 灵 并 没有 对 机 带 和 思考 进行 定义 ， 而 是 设计 了 一 个 洲 戏 一 一 图 灵 模 拟 游 戏 ， 用 放 戏 阐述 
他 对 机 融和 思考 的 理解 ， 从 而 避免 了 关于 定义 的 异议 。 图 灵 认 为 ， 与 其 问 “ 机 融 能 否 思考 ” ， 不 
如 问 “ 机 融 能 否 通过 智能 行为 测试 ” 。 他 曾经 预测 ， 到 公元 2000 年 时 ， 计 算 机 能 够 通过 程序 与 
人 进行 5 分 钟 对 话 ， 并 有 30% 的 机 会 使 对 话 的 人 认为 对 方 不 是 计算 机 ， 而 是 人 。 图 灵 将 计算 机 
镶 能 行为 定义 为 在 认 知 任务 中 达到 人 类 行为 水 平 的 能 力 。 换 句 话 说， 如 果 对 话 者 依据 所 提问 题 
的 答案 无 法 判断 对 方 是 人 还 是 机 天 ， 计 算 机 就 通过 了 测试 。 

图 灵 模 拟 洲 戏 包 括 两 个 阶段 。 在 第 一 阶段 ， 如 图 1. 1 所 示 ， 一 个 审讯 员 和 一 男 一 女 分 别 被 安 
排 在 单独 的 空间 ， 他 们 只 能 通过 远程 终 痢 之 类 的 中 介 进 行 交 流 。 审 讯 员 的 目标 是 通过 对 为 外 两 
个 人 提问 ， 根 据 他 们 的 回答 来 判断 谁 是 男 的 、 谁 是 女 的 。 游 戏 规则 是 男士 要 尽力 让 审讯 员 认 为 他 
是 女士 ， 而 女士 则 和 需 疝 审讯 员 证 明 她 是 女士 。 

游戏 的 第 二 个 阶段 ， 如 图 1.2 所 示 ， 用 一 台 计 算 机 代 蔡 男士 ,计算 机 的 任务 和 第 一 阶段 中 男 
士 的 任务 一 样 。 对 计算 机 编程 时 ， 为 了 更 好 地 檬 拟人 类 ， 故 意 让 计算 机 犯错 或 提供 模糊 的 答案 。 
如 果 计 算 机 成 功 “ 骗 过 ”审讯 员 的 次 数 和 男士 成 功 “ 骗 过 ”审讯 员 的 次 数 一 怪 ， 则 认为 计算 机 
通过 了 智能 行为 测试 。 


























图 1.1 图 灵 模 拟 游戏 : 第 一 阶段 图 1.2 图 灵 模 拟 游戏 : 第 二 阶段 





对 于 人 的 号 体 模拟 在 智能 测试 中 并 不 重要 。 因 此 ， 图 录 测 试 中 ， 审 讯 员 看 不 见 、 触 不 到 、 嘎 
不 到 计算 机 ， 因 此 不 会 受 计算 机 的 外 表 或 声 首 的 干扰 。 但 是 为 了 辨别 出 计算 机 ， 审 讯 员 可 以 问 任 
何 问题 ， 甚 至 是 过 激 的 问题 。 例 如 ， 审 讯 员 可 以 让 人 和 计算 机 做 复杂 的 数学 计算 ， 如 来 一 方 提 供 
本 正确 答案 ， 并 且 比 对 方 速度 快 ， 可 以 判断 这 一 方 就 是 计算 机 。 因 此 ， 计 算 机 必须 知道 何 时 故意 
出 错 、 何 时 延迟 回答 。 审 讯 员 也 可 能 会 问 双方 天 于 短篇 小 说 、 诗 歌 、 绘 画 方面 的 问题 ， 由 此 可 以 
推 呆 出 一 方 具 有 的 明显 的 人 类 专属 的 情绪 特征 。 当 面 对 这 一 类 问题 时 ， 计 算 机 就 必须 模拟 人 类 
对 事物 的 感性 理解 。 
图 灵 测 试 很 通用 ， 原 因 是 测试 具备 了 两 个 显 考 特征 : 
e 由 于 使 用 终端 进行 人 机 交互 ， 这 一 测试 让 我 们 对 管 能 有 客观 的 衡量 标准 ， 人 避免 了 对 人 类 入 
能 本 质 的 争论 ， 并 排除 了 偏 回 人 类 的 可 能 性 。 
e 测试 本 号 独立 于 实验 细节 。 既 可 以 像 前 述 的 进行 两 阶段 测试 ， 也 可 以 变 成 一 个 阶段 的 测 
试 ， 从 一 开始 就 让 审讯 员 对 人 与 机 带 进 行 判 断 。 审 讯 员 既 可 以 提 任 何 领域 的 任何 问题 ， 也 
可 以 只 关注 答案 本 号 。 
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图 灵 相 信和 到 20 世纪 末 ， 能 够 通过 对 数字 计算 机 编程 来 完成 测试 游戏 。 尽 管 现 代 计 算 机 还 没 
有 通过 图 灵 测 试 ， 但 已 经 为 我 们 提供 了 基于 知识 的 系统 的 评估 和 验证 基础 。 通 过 与 人 类 专家 行 
为 对 比 ， 已 经 对 一 些 狭 罕 专 业 领 域 的 具有 智能 的 程序 进行 了 评估 。 

我 们 的 大 脑 具 有 108 位 的 容量 ， 能 够 每 秒 处 理 105 位 的 信息 。 到 2020 年 ， 也 许 一 块 方 糖 大 小 
的 芯片 就 足以 模拟 人 脑 ， 也 许 会 有 计算 机 能 够 通过 图 灵 测 试 游戏 。 但 是 ,我 们 走 的 想 让 计算 机 在 
做 数学 计算 时 ， 像 人 一 样 又 慢 又 会 出 错 吗 ?” 实际 上 上， 智能 机 应 该 能 够 帮助 人 类 进行 决策 、 搜 索 信 
息 、 控 制 复 杂 对 象 ， 最 终 理解 单词 含义 。 也 许 没有 必要 片面 追求 使 计算 机 像 人 一 样 聪明 这 一 既 抽 
象 又 艰深 的 目标 。 为 了 构建 一 套 乔 能 机 系统 ， 我 们 必须 去 捕捉 、 组 织 和 使 用 某 个 狭窄 专业 领域 的 
人 类 专家 知识 。 


12 人 工 智能 的 发 展 历 史 ， 从 “ 黑 瞳 时 代 ” 到 基于 知识 的 系统 
人 工 智能 成 长 为 一 门 科学 ， 历 经 三 代 研 究 者 的 努力 。 这 一 节 就 来 介绍 每 一 代 研 究 者 对 人 工 
智能 学 科 所 做 的 贡献 和 重大 事件 。 


.2.1 “黑暗 时 代 ”， 人 工 智 能 的 诞生 (1943 年 ~1956 =) 


Warren McCulloch 和 Walter Pitts 在 1943 年 发 表 了 了 人工 智能 领域 的 开篇 之 作 。McCulloch 拥有 
哥伦比亚 大 学 的 哲学 和 医学 学 位 ， 后 来 在 伊利 诡 伊 大 学 的 精神 病 学 系 担任 基础 研究 实验 室 的 主 
任 。 他 在 对 中 枢 神 经 系统 的 研究 中 提出 了 大 脑 神经 元 模型 ,最早 为 人 工 入 能 做 出 了 主要 页 献 。 

McCulloch 和 年 轻 的 数学 家 Walter Pitts 合作 ， 提 出 了 人 工 神 经 网 络 模型 ， 这 个 模型 假定 每 个 
神经 元 有 两 个 状态 : JF. X (McCulloch and Pitts, 1943 ) 。 并 证 明 他 们 的 神经 网 络 模型 实际 上 等 
价 于 图 灵机 ， 并 且 任 何 可 计算 函数 都 可 以 由 相连 的 神经 元 网 络 进行 计算 。 同 时 揭示 了 简单 的 网 
络 结构 具有 学 习 功 能 。 

神经 元 网 络 模型 从 理论 和 实验 两 个 方面 激发 了 对 大 脑 模型 的 研究 。 人 但是， 实验 结 果 清 晰 地 
表明 将 神经 元 限制 为 两 个 状态 是 不 正确 的 。 事 实 上 ， 神 经 元 具有 明显 的 非 线性 特征 ， 而 非 简单 的 
二 元 状态 。 即 使 如 此 ，McCulloch 是 人 工 千 能 领域 继 阿 兰 . 图 灵 之 后 的 第 二 个 创始 人 ， 为 神经 计 
算 和 人 工 智 能 网 络 ( Artificial Neural Networks, ANN) 奠定 了 基础 。 人 工 神 经 网 络 的 研究 在 20 TH 
纪 70 年 代 经 历 了 衰退 ， 在 20 世纪 80 年 代 后 期 重新 复苏 。 

人 工 智能 的 第 三 个 芮 基 人 是 聪明 的 匈牙利 籍 数学 家 John von Neumann。 他 在 1930 年 加 入 了 普 
林 斯 顿 大 学 ， 在 数学 物理 系 任教 。 他 是 阿兰 . 图 灵 的 同事 和 朋友 。 在 第 二 次 世界 大 战 期 间 ，von 
Neumann 在 建造 原子 弹 的 “曼哈顿 项 目 ” 中 担任 重要 角色 ， 并 成 为 宾夕法尼亚 大 学 的 ENIAC 
(Electronic Numerical Integrator and Calculator, HAA Mita as) 项 目的 顾问 ， 参 与 设计 了 
EDVAC 计算 机 (Electronic Discrete Variable Automatic Computer， 电 子 离散 变量 日 动 计算 机 ) A 
McCulloch 和 Pitts 所 提出 的 神经 网 络 模 型 使 von Neumann 受到 局 发 。 因 此 , Æ 1951 年 ， 当 来 目 普 
林 斯 顿 大 学 数学 系 的 两 个 人 研究生 Marvin Minsky 和 Dean Edmonds 建造 第 一 台 神 经 网 络 计算 机 时 ， 
von Neumann 或 励 并 资助 了 他 们 。 

在 第 一 代 研 究 者 中 ， 不 得 不 提 Claude Shannon, fl EE My FRETKI F 1941 年 加 入 贝尔 
实验 室 。Shannon 继承 了 阿兰 . 网 灵 的 观点 ， 认为 可 以 使 机 需 智 能 化 。 在 1950 年 ， 他 发 表 了 一 篇 
关于 让 机 顺 下 象棋 的 文章 ， 文 章 指出 一 盘 典 型 的 棋 赛 大 约 有 10 ”次 的 移动 (Shannon，1950)。 即 
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© EDVAC 是 一 个 存储 程序 的 机 和 需 。 
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使 一 台新 的 von Neumann 式 计算 机 每 微 秒 就 能 测试 一 种 走 法 ,移动 第 一 步 也 得 花 上 3 x10 E, 
因此 ，Shannon 论证 了 在 寻找 解决 方案 时 使 用 启发 式 策 略 的 必要 性 。 

另 一 位 人 工 智能 更 基 人 John McCarthy 也 来 日 普林斯顿 大 学 。 他 从 普林斯顿 大 学 毕业 后 去 达 
特 节 斯 学 院 工 作 。 他 说 服 了 了 Marvin Minsky 和 Claude Shannon 在 达 特 芒 斯 学 院 组 织 一 个 赌 期 人 研 讨 
会 。 在 1956 年 ， 他 们 召集 了 对 机 融 知 能、 人 工 神 经 网 络 和 目 动 理论 感 兴 趣 的 研究 者 ， 参 加 由 
IBM 赞助 的 研讨 会 。 尽 管 研 讨 会 仪 有 10 人 参加 ,但 这 次 会 议 却 促成 了 人 工 智 能 学 科 的 诞生 。 在 
之 后 的 20 年 里 ， 参 加 过 达 特 区 斯 学 院 研 讨 会 的 学 者 及 他 们 的 学 生 在 人 工 镶 能 领域 一 下 起 主导 
作用 。 
1.2.2 ”人工 智能 的 上 升 期 ， 远 大 目标 积极 实现 的 年 代 (1956 年 ~20 世纪 60 FR 

晚期 ) 


在 人 工 智 能 学 科 的 发 展 早期 ， 可 以 用 热情 巨大 、 想 法 大 胆 ， 但 成 果 很 少 来 形容 。 当 时 ， 计 算 
机 被 用 来 做 常规 数学 计算 才 几 年 时 间 ， 而 人 工 智能 领域 的 研究 者 却 已 在 论证 计算 机 的 本 领 远 超 
过 这 些 。 这 真是 一 个 有 远大 目标 并 积极 付 诸 实现 的 年 代 。 

John McCarthy 作为 达 特 茅 斯 学 院 人 研讨 会 的 组 织 者 之 一 ， 也 是 “人 工 乔 能 ”这 一 术语 的 发 明 
者 ， 从 达 特 茅 斯 学 院 转 到 了 麻 省 理工 学 院 。 他 设计 了 高 级 语言 LISP。LISP 是 早期 编程 语言 之 一 
(FORTRAN 仅 比 它 早 了 两 年 ) ， 到 今天 还 有 人 在 用 。 在 1958 Æ, McCarthy 发 表 了 论文 “基于 常 
识 的 程序 ”， 文 中 提出 了 一 个 名 为 “建议 采纳 者 ” (Active Taker) 的 程序 ， 用 于 搜索 一 般 性 问题 
的 解决 方案 (McCarthy, 1958), McCarthy 论证 了 设计 和 生成 程序 的 方法 ， 他 以 驾车 去 机 场 为 例 ， 
采用 这 个 程序 基于 几 个 简单 的 规则 设计 了 轰 驶 计划 。 更 重要 的 是 ， 程 序 无 须 变动 ， 就 可 以 接受 来 
自 不 同 专业 领域 的 新 的 规则 ， 即 可 以 接受 新 知识 。 因 此 ,“ 建 议 采 纳 者 ”是 第 一 个 真正 集成 了 知 
识 表达 和 推理 的 核心 法 则 的 基于 知识 的 系统 。 

达 特 茅 斯 学 院 人 研讨 会 的 男 一 个 组 织 者 Marvin Minsky EIA TREET, MMR McCar- 
thy 那样 专注 于 形式 逻辑 ， 而 是 建立 了 一 套 反 逻辑 的 观点 ， 以 处 理 知 识 表达 和 推理 。 他 的 框架 理 
论 为 知识 工程 做 出 了 主要 的 贡献 (Minsky，1975 ) 。 

由 McCulloch 和 Pitts 开创 的 神经 计算 和 人 工 神经 网 络 的 早期 研究 得 以 继续 。 随 着 学 习 方 法 的 
改进 和 提高 ，Frank Rosenblatt 证 明了 感知 器 收敛 理论 ， 并 论证 他 的 学 习 算 法 能 够 调整 感知 器 的 连 
fete (Rosenblatt, 1962) 。 

GPS (General Problem Solver， 通 用 问题 解决 方案 ) 是 在 这 个 大 胆 假设 年 代 最 具 野 心 的 项 目 
之 一 (Newell and Simon, 1961; 1972) 。 卡 内 基 - 梅 隆 大 学 的 Allen Newell 和 Herbert Simon 设计 
了 一 个 通用 程序 ， 用 于 模拟 人 类 在 解决 问题 时 的 方法 。GPS 也 许 是 第 一 个 尝试 将 解决 问题 的 技术 
和 数据 分 开 的 程序 。 它 使 用 了 现在 已 被 称 为 手段 - 目的 分 析 (means-ends analysis) 的 技术 。New- 
ell 和 Simon 假定 可 以 用 状态 去 定义 问题 。 手 段 -目的 的 作用 是 判断 问题 的 当前 状态 和 期 望 状态 
或 目标 状态 的 差距 ， 并 选择 操作 算 子 去 达到 目标 状态 。 如 条 从 当前 状态 不 能 直接 到 达 目 标 状 态 ， 
就 要 建立 一 个 更 接近 目标 状态 的 新 状态 ， 重复 这 一 过 程 直 到 达到 目标 状态 。 操 作 算 子 集合 决定 
了 解决 方案 。 

但 是 ，GPS 无 法 解决 复杂 问题 。 由 于 程序 建立 在 形式 逻辑 的 基础 上 ， 操 作 算 子 可 能 有 无 穷 多 
个 ， 导 致 效 率 低下 。 在 解决 实际 问题 时 ，GPS 需要 大 量 运 算 时 间 和 内 存 ， 这 导致 人 们 后 来 放弃 
GPS 计划 。 

总 之 ， 在 20 世纪 60 年代， 为 了 模拟 复杂 的 思考 过 程 ， 人 工 吞 能 人 研究 者 试图 研究 通用 方法 来 
解决 广泛 的 问题 。 他 们 使 用 了 通用 搜索 束 略 以 寻找 解决 方 宁 。 通 用 搜索 策略 现在 被 称 为 弱 方 法 ， 
由 于 使 用 的 是 问题 域 的 弱 信 息 ， 导 致 程 序 的 性 能 低下 。 
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不 管 怎 样 ， 这 个 发 展 阶段 吸引 了 伟大 的 科学 家 针对 人 工 智 能 各 个 方面 提出 创新 性 的 基础 理 
论 ， 例 如 在 知识 表达 、 学 习 算 法 、 神 经 计算 以 及 文字 计算 等 诸 方面 。 当 时 由 于 计算 机 性 能 的 限 
制 ， 这 些 理论 并 未 实现 ， 但 却 为 20 年 后 的 实际 应 用 指明 了 方向 。 

值得 一 提 的 是 ,来 自 加 州 大 学 伯克利 分 校 的 Lotfi Zadeh 教授 也 在 20 世纪 60 年 代 发 表 了 著名 
的 文章 “模糊 集 ”(Zadeh，1965) 。 现 在 人 们 一 致 认为 这 篇 文章 为 模糊 集 理论 奠定 了 基础 。20 年 
后 ， 模 糊 集 理论 人 研究 者 已 经 构建 了 成 百 上 千 的 智能 机 和 智能 系统 。 

KATA BES AGRE YT CB 1970 年 结束 ， 大 部 分 政府 资助 的 人 工 智 能 项 目 也 被 迫 取 消 。 人 
工 智能 仍 是 一 个 相对 新 的 领域 , 偏 于 学 术 性 ， 除 了 一 些 游戏 之 外 几乎 没有 实际 应 用 (Samuel, 
1959; 1967; Greenblatt et al. ，1967 ) 。 在 外 界 看 来 ， 由 于 不 存在 能 解决 实际 问题 的 人 工 智 能 系 
统 ， 所 取得 的 成 绩 也 只 是 小 玩意 而 已 。 


1.2.3 没有 履行 的 诡 言 ， 来 自 现实 的 冲击 (20 世纪 60 FREH ~20 世纪 70 年 代 早 期 ) 


从 20 世纪 50 年 代 中 期 ， 人 工 智 能 研究 者 就 承诺 到 20 世纪 80 年 代 建 造 出 与 人 类 智能 相当 的 
全 能 智能 机 ， 到 公元 2000 年 ， 建 造 出 超越 人 类 智能 的 智能 机 。 但 到 1970 年 时 ,他们 已 经 意识 到 
这 些许 诺 过 于 乐观 。 虽 然 个 别 智 能 程序 能 够 在 一 两 个 小 问题 上 展示 出 一 定 水 平 的 智能 ， 但 几乎 
所 有 的 人 工 智 能 项 目 都 对 稍 宽泛 的 问题 和 实际 的 复杂 问题 无 能 为 力 。 

在 20 世纪 60 年 代 晚 期 ， 人 工 乔 能 学 科 存 在 的 问题 主要 表现 在 以 下 儿 个 方面 。 

e 由 于 人 工 智 能 研究 者 专注 于 开发 能 解决 广义 问题 的 一 般 方 法 ， 因 此 早期 的 程序 只 包含 很 少 
甚至 没有 相关 问题 域 的 知识 。 为 了 解决 问题 ， 程 序 中 应 用 了 一 种 搜索 案 略 ， 尝 试 对 小 步骤 
进行 不 同 的 组 合 ， 和 直到 找 出 真正 的 解决 方案 。 由 于 这 种 思路 对 于 小 问题 是 有 效 的 ， 因 而 被 
误 认 为 可 以 通过 对 程序 进行 扩展 来 解决 更 大 的 问题 。 事 实 上 ， 这 种 想法 是 错误 的 。 

简单 的 而 多 处 理 的 问题 在 多 项 式 级 的 时 间 内 就 得 以 解决 ， 就 是 说 ， 对 于 一 个 规模 为 n 的 问 

题 ， 所 需 的 求解 时 间或 求解 步 又 数 是 n 的 多 项 式 图 数 。 而 解决 国手 而 不 易 处 理 的 问题 所 需 的 时 间 
是 问题 规模 的 指数 级 函数 。 一 般 认 为 ， 多 项 式 级 运算 时 间 的 算法 是 高 效 的 ， 而 指数 级 运算 时 间 的 
算法 则 是 低 效 的 ， 原因 是 后 者 的 运算 时 间 随 着 问题 规模 的 增 大 而 呈 飞 速 增长 。20 世纪 70 年 代 早 
期 所 提出 的 NP 完全 问题 理论 (NP-Completeness) (Cook, 1971; Karp, 1972) 揭示 出 一 大 类 非 
确定 多 项 式 级 问题 (Non- deterministic Polynomial problem, NP 问题 ) 都 是 NP 完全 问题 。NP 问题 
是 指 能 够 在 多 项 式 时 间 内 估算 并 进行 验证 的 问题 (假设 有 解 ) 。 非 确定 是 指 不 存在 特定 算法 来 进 
行 估 算 。 而 NP 完全 问题 则 是 NP 问题 中 最 难 的 问题 ， 即 使 用 速度 最 快 、 内 存 最 大 的 计算 机 也 难 
以 求解 。 

e 许多 人 工 留 能 试图 解决 的 问题 剖 太 宽 沁 、 太 复杂 。 早 期 人 工 乔 能 的 一 个 典型 任务 就 是 机 各 
翻 详 。 例 如 ， 在 前 办 联 于 1957 年 发 射 第 一 条 人 造 卫 星 Sputnik 之 后 ,美国 国家 人 研究 委员 会 
就 资助 针对 俄语 科学 文献 的 机 各 翻 详 项 目 。 最 初 ， 项 目 团 队 想 利 用 电子 词典 直接 将 俄语 单 
词 殖 换 为 对 应 的 瑞 语 单词 。 不 久 他 们 便 发 现 只 有 了 解 了 文献 主题 才能 正确 选择 单词 。 由 于 
任务 太 难 ，1966 年 由 美国 政府 资助 的 所 有 翻译 项目 部 被 取消 。 

e 在 1971 F, 天 国政 府 也 终止 了 对 人 工 乔 能 人 研究 的 资助 。 严 国 科学 人 研究 委员 会 派 James 
Lighthill 岁 士 调研 当时 的 人 工 乔 能 人 研究 现状 ， 他 发 现 人 工 乔 能 领域 并 没有 重大 甚至 显眼 的 
研究 成 末 ， 因 而 认为 不 必 保 留 一 个 独立 的 “人 工 智 能 ”学 科 。 


1.2.4 ”专家 系统 技术 ,成功 的 关键 因素 (20 世纪 70 年 代 早期 ~20 世纪 80 年 代 中 期 ) 


20 世纪 70 年 代 最 重要 的 进展 ， 也 许 就 是 人 们 意识 到 必须 对 智能 机 带 的 问题 域 进行 充分 限 
制 。 而 在 此 之 前 ， 人 工 智能 研究 者 一 直 认 为 ， 为 了 对 通用 的 、 人 类 惯用 的 解决 问题 的 方法 进行 仿 
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真 ， 必 须 创 造 出 聪明 的 搜索 算法 和 推理 技术 。 一 种 通用 的 搜索 机 制 可 以 依赖 基本 的 推理 步骤 来 
发 现 完整 的 解决 方案 并 可 以 使 用 问题 域 的 弱 知 识 。 然 而 ， 当 这 种 弱 方 法 失败 后 ， 研 究 者 们 最 终 意 
识 到 ， 唯 一 出 路 是 使 用 大 量 推 理 步 又 来 解决 锋 罕 专业 领域 的 典型 问题 。 

DENDRAL 是 当时 的 一 个 典型 例子 (Buchanan et al. ，1969)， 其 由 斯 坦 福 大 学 开发 ， 用 于 化 
学 分 析 。NASA 资助 了 这 个 项 目 ， 原 因 是 当时 美国 要 发 射 一 个 无 人 宇宙 飞船 到 火星 ,需要 根据 由 
质 详 仪 提供 的 大 量 光 谱 数 据 ， 由 此 设计 程序 以 分 析 火 星 表 面 土壤 的 分 子 结构 。Edward Feigenbaum 
( 曾 是 Herbert Simon 的 学 生 ) , Bruce Buchanan (计算 机 科学 家 ) , Joshua Lederberg (遗传 学 领域 
的 诺 贝尔 奖 获 得 者 ) 组 成 团队 来 解决 这 一 挑战 性 的 问题 。 

这 类 问题 的 传统 解决 方法 都 依赖 于 枚 举 一 测 试 技 术 : 首先 枚 举 出 与 质谱 图 一 致 的 所 有 可 能 
的 分 子 结构 ， 用 每 一 个 分 子 结构 预测 质谱 ， 再 根据 实际 的 质谱 进行 检验 。 但 是 ， 由 于 分 子 结构 会 
达到 千 百 万 个 ， 即 使 分 子 数 目 适 中 ， 问 题 也 会 迅速 复杂 化 ， 因 此 这 种 方法 是 行 不 通 的 。 

更 困难 的 是 ， 没 有 科学 的 算法 将 质谱 图 匹配 到 对 应 的 分 子 结构 。 不 过 ， 像 Lederberg 这 样 的 
分 析 化 学 家 可 以 使 用 他 们 的 技巧 、 经 验 和 特长 解决 这 个 问题 。 通 过 找 出 质谱 图 中 的 高 峰 期 所 具 
有 的 明显 的 模式 ， 可 以 大 大 降低 可 能 的 分 子 结构 数目 ， 再 使 用 几 个 可 行 的 方法 进一步 求解 。 所 
VA, Feigenbaum 的 任务 就 是 在 程序 设计 时 将 Lederberg 的 专业 知识 考虑 进来 ， 以 使 程序 具有 相当 
于 人 类 专家 的 水 平 。 这 种 程序 后 来 被 称 为 专家 系统 。 要 想 理解 、 采 纳 Lederberg 的 知识 ， 并 用 他 
的 术语 进行 操作 ，Feigenbaum 需要 学 习 化 学 和 质谱 分 析 的 基本 知识 。 当 然 ， 他 不 仅 需 要 使 用 化 学 
规则 ， 也 需要 基于 其 经 验 和 猜测 ， 并 使 用 他 自己 的 经 验 法 则 之 类 的 启发 式 方法 。 不 久 Feigenbaum 
就 发 现 项 目 中 的 一 个 主要 困难 是 如 何 从 人 类 专家 那里 抽取 知识 并 应 用 于 计算 机 ， 他 将 这 一 问题 
称 为 “知识 获取 瓶 贷 ”。 为 了 更 清楚 地 表达 知识 ，Lederberg 也 需要 学 习 计 算 方面 的 基础 知识 。 

Feigenbaum, Buchanan 和 Lederberg 组 成 团队 ,最终 成 功 开 发 出 了 第 一 个 基于 知识 的 系 
统一 一 DENDRAL。 他 们 成 功 的 关键 在 于 将 所 有 相关 的 理论 知识 从 泛 化 形式 映射 到 极为 具体 的 规 
W (“FERR”) (Feigenbaum et al. , 1971), 

DENDRAL 的 巨大 意义 可 以 归纳 为 如 下 几 点 : 

e DENDRAL 标志 看 人 工 智 能 领域 重要 的 “范式 转移 ”， 即 从 通用 的 、 知 识 稀 玻 型 能 方 法 转 

移 到 针对 特定 领域 的 知识 密集 型 技术 。 

e DENDRAL 项 目的 目标 是 设计 出 能 达到 有 经 验 的 化 学 家 水 平 的 计算 机 程序 。 通 过 提取 人 类 
专家 知识 ， 并 表达 为 高 质量 的 具体 规则 (经 验 法 则 ) ，DENDRAL 团队 使 用 这 种 局 发 式 策 
略 证 明了 计算 机 在 特定 、 可 定义 的 问题 领域 能 达到 专家 水 平 。 

e DENDRAL 为 专家 系统 开创 了 新 的 方法 论 ， 即 知识 工程 ， 它 包含 了 对 专家 知识 从 获取 、 分 
析 到 用 规则 表达 等 一 系列 扩 术 。 

DENDRAL 后 来 成 为 化 学 家 们 有 用 的 分 析 工 具 ， 并 在 美国 成 为 商业 产品 被 投放 到 市 场 。 

Feigenbaum 和 来 目 斯 坦 福 大 学 的 人 员 接 下 来 承担 了 医疗 诊断 方面 的 一 个 重大 项 目 ， 这 个 项 目 
名 为 MYCIN， 始 于 1972 年 ， 后 来 成 为 Edward Shortliffe 的 博士 论题 ( Shortliffe, 1976), MYCIN 
是 基于 规则 的 专家 系统 ， 它 的 任务 是 诊断 传染 性 的 血液 病 ， 它 还 以 一 种 便捷 、 用 户 友好 的 方式 为 
医生 提供 治疗 建议 。 

MYCIN 与 早期 专家 系统 具有 和 在 干 相同 特点 : 

e MYCIN 的 性 能 相当 于 人 类 专家 水 平 ， 并 高 于 初级 医生 的 水 平 。 

e MYCIN 包含 了 450 条 独立 的 下 -THEN 形式 的 规则 ， 这 些 知 识 是 通过 访问 特定 领域 的 大 量 

专家 获得 的 。 

e 以 规则 形式 表达 的 知识 与 推理 机 制 明 确 地 分 开 了 。 系 统 人 研发 员 也 能 够 轻易 地 通过 插入 、 删 

除 规则 来 操纵 知识 。 例 如 ， 斯 坦 福 大 学 后 来 研发 了 一 个 独立 于 领域 知识 的 MYCIN 版 本 ， 
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称 为 EMYCIN (van Melle, 1979; van Melle et al. , 1981) 。 它 除了 传染 性 血液 病 知 识 之 外 ， 
具有 MYCIN 的 一 切 特征 。EMYCIN 促进 了 诊断 方面 的 各 种 应 用 。 系 统 研 发 员 只 需 将 新 知 
识 以 规则 形式 添加 ， 就 能 实现 新 的 应 用 。 

与 早期 专家 系统 相 比 ，MYCIN 也 有 一 些 新 特点 。 例 如 ，MYCIN 的 规则 反映 了 知识 本 里 的 不 
确定 性 ， 这 里 是 指 医学 诊断 知识 。 它 在 可 利用 的 数据 或 医生 所 给 的 数据 上 测试 规则 的 条 件 部 分 
(IF 部 分 ) 。 在 适当 时 候 ，MYCIN 使 用 名 为 确信 因子 的 不 确定 性 运算 推断 是 否 满足 条 件 。 考 虑 不 
确定 性 的 推理 是 这 个 系统 的 最 重要 的 特征 。 

另 一 个 被 广泛 关注 的 概率 系统 是 PROSPECTOR， 这 一 专家 系统 由 斯 坦 福 研究 院 开 发 ， 用 于 
矿产 勘探 (Duda et al. ，1979 ) 。 这 个 项 目 始 于 1974 年 ， 在 1983 年 结束 ， 有 9 位 专家 为 该 系统 提 
供 了 专业 知识 。PROSPECTOR 将 规则 和 语义 网 络 合 并 到 一 个 结构 中 ， 以 表达 专家 知识 ， 并 使 用 
了 一 千 多 条 规则 来 表达 大 量 领域 知识 。 同 时 拥有 一 个 复杂 的 文 持 包 ， 其 中 包括 知识 获取 系统 。 

PROSPECTOR 的 工作 原理 是 ， 首 先 让 作为 用 户 方 的 勘探 地 质 学 家 输入 待 检 矿 床 的 特征 ， 如 
地 址 环境 、 结 构 、 矿 物质 类 型 等 。 之 后 ， 程 序 将 这 些 特 征 与 矿床 模型 比较 ， 必 要 时 让 用 户 提供 更 
多 信息 。 最 后 ， 系 统 对 竺 检 矿 床 做 出 结论 。 这 一 系统 也 能 够 解释 为 了 得 出 结论 所 用 到 的 步骤 。 

在 勘探 地 质 学 领域 ， 重 要 决策 常常 是 在 由 于 知识 不 完整 或 模糊 而 导致 不 确定 性 的 情况 下 做 
出 的 。 为 了 处 理 这 类 知识 ，PROSPECTOR 使 用 论据 贝 叶 斯 规则 在 系统 中 传送 不 确定 性 。 它 的 性 
能 达到 了 专业 地 质 学 家 的 水 平 ， 并 且 在 实践 中 得 到 了 验证 。 在 1980 年 ， 用 它 识别 出 了 华盛顿 州 
Tolman 山 附 近 的 一 个 钼 矿床 。 随 后 一 个 采矿 公司 对 这 个 矿床 开采 时 证 实 这 个 矿床 价值 一 亿美 元 。 
真是 难以 想象 专家 系统 能 有 如 此 价值 。 

上 面 所 提 到 的 几 个 专家 系统 现在 已 成 为 经 典 之 作 。20 世纪 70 年 代 后 期 ， 专 家 系统 越 来 越 多 
地 被 成 功 应 用 ， 这 表明 能 够 将 人 工 智 能 技术 从 实验 室 成 功 地 移植 到 商业 领域 。 不 过 ， 这 一 时 期 大 
部 分 专家 系统 都 是 在 功能 强大 的 工作 站 上 ， 采 用 特殊 的 人 工 智 能 语言 开发 的 ， 例 如 LISP, PRO- 
LOG 以 及 OPS。 昂贵 的 人 硬件 和 复杂 的 程序 语言 意味 着 专家 系统 的 开发 工作 只 能 由 个 别 院 校 的 研究 
组 做 ， 像 斯 坦 福 大 学 、 麻 省 理工 学 院 、 斯 坦 福 人 研究 院 和 卡 内 基 - 梅 隆 大 学 。 到 了 20 世纪 80 年 
R, 个 人 电脑 和 易 用 的 专家 系统 开发 工具 框架 的 出 现 ， 才 使 得 普通 的 研究 者 和 各 个 领域 的 工程 
师 都 有 机 会 开发 专家 系统 。 

1986 年 的 一 份 综述 报告 汇总 了 大 量 成 功 应 用 于 不 同 领域 的 专家 系统 ， 所 应 用 的 领域 包括 化 
学 、 电 子 、 工 程 、 地 质 、 管 理 、 医 药 、 过 程控 制 和 军事 科学 ， 等 等 (Waterman, 1986), AE Ul 
IE, Æ Waterman 发 现 的 将 近 200 个 专家 系统 中 ， 大 部 分 还 是 应 用 在 医学 诊断 领域 。7 年 后 男 一 篇 
综述 汇总 了 2500 多 个 开发 完毕 的 专家 系统 (Durkin, 1994) 。 新 兴 的 应 用 领域 是 商业 和 制造 业 ， 
占 了 总 应 用 的 60% 。 此 时 专家 系统 技术 已 经 成 熟 。 

专家 系统 在 任何 领域 都 是 成 功 的 关键 吗 ? 虽然 有 了 大 量 的 专家 系统 ， 并且 在 不 同 知 识 领域 
得 以 成 功 地 应 用 ， 但 高 估 这 一 技术 的 能 力 是 不 对 的 。 在 技术 和 社会 学 两 个 层面 都 存在 复杂 的 困 
难 ， 这 些 困 难 包括 : 

e 专家 系统 局 限于 非常 狭窄 的 专业 领域 。 例 如 ， 虽 然 MYCIN 的 任务 是 诊断 传染 性 血液 病 ， 
却 没有 人 体 生 理学 的 知识 。 如 果 病 人 的 病 不 止 一 个 ， 就 不 能 指望 MYCIN 了。 事实 上 ， 当 
病人 伴随 其 他 疾病 时 ， 使 用 MYCIN 开 的 治疗 血液 病 的 处 方 甚至 可 能 是 有 害 的 。 

e 由 于 局 限于 狭 宗 的 领域 ， 专 家 系统 并 不 能 如 用 户 所 愿 的 那样 健壮 灵活 。 并 且 ， 专 家 系统 难 
以 识别 领域 界限 。 当 一 项 任务 不 同 于 传统 问题 时 ， 专 家 系统 可 能 在 尝试 解决 时 出 乎 意料 地 
失败 。 

e 专家 系统 的 解释 能 力 有 限 。 虽 然 能 够 显示 解决 方案 中 应 用 的 一 系列 规则 ， 却 无 法 将 累积 的 
启发 式 知 识 与 对 问题 领域 的 深层 理解 关联 起 来 。 
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e 专家 系统 难以 检验 验证 。 至 今 都 没有 开发 出 通用 的 技术 来 分 析 专 家 系统 的 完整 性 和 一 致 
性 。 启 发 式 规则 以 抽象 形式 表达 知识 ， 缺 乏 对 领域 的 基本 理解 ， 这 使 得 识别 错误 的 、 不 完 
整 或 不 一 致 的 知识 的 工作 非常 困难 。 

e 专家 系统 几乎 不 具备 从 它们 的 经 验 中 去 学 习 的 能 力 ， 尤 其 是 第 一 代 专 家 系统 。 专 家 系统 的 
开发 相对 独立 而 且 开 发 过 程 慢 。 解 决 一 个 中 等 难度 的 问题 要 花费 5 ~ 10 人 年 的 时 间 
(Waterman ,1986) 。 而 像 DENDRAL, MYCIN 或 PROSPECTOR 之 类 的 复杂 系统 需要 超过 30 
人 年 的 开发 时 间 。 如 有 果 专 家 系统 的 完善 依赖 于 它 的 开发 者 进一步 关注 ， 那 么 这 些 巨大 的 投 
入 将 难以 评估 。 

尽管 面临 这 么 多 的 困难 ， 专 家 系统 的 人 研究 还 是 有 了 很 大 突破 ， 并 在 奉 干 重要 应 用 中 证 明了 

EMME. 


1.2.5 如 何 使 机 器 学 习 ， 神 经 网 络 的 重生 (20 世纪 80 年 代 中 期 至 今 ) 


在 20 世纪 80 年 代 中 期 人 研究 者 、 工 程 师 以 及 专家 们 意识 到 ， 购 买 一 个 推理 系统 或 专家 系统 
WEAR, 再 往 里 填充 足够 的 规则 ， 并 不 足以 构造 一 个 专家 系统 。 应 用 专家 系统 技术 的 幻想 破灭 ， 对 
人 工 智能 项 目的 资助 也 严重 紧 绑 ， 甚 至 导致 人 们 开始 预测 人 工 智能 的 “冬季 ”将 要 到 来 。 人 工 
智能 研究 者 们 决定 重新 审视 神经 网 络 。 

到 20 世纪 60 年 代 后 期 ， 神 经 计算 所 需 的 基本 理论 和 概念 大 部 分 都 已 经 成 型 (Cowan, 
1990) 。 但 是 ， 百 到 20 世纪 80 年 代 中 期 才 出 现 解决 方案 ， 汪 后 的 主要 原因 在 于 技术 层面 : 没有 
个 人 电脑 或 功能 强大 的 工作 站 ， 所 以 无 法 对 人 工 神 经 网 络 建 模 和 实验 。 还 有 心理 学 和 资金 方面 
的 原因 。 例 如 ， 在 1969 年 ，Minsky 和 Papert 就 用 数学 方法 论证 了 单 层 感知 冀 有 具有 根本 的 计算 局 
限 性 (Minsky and Papert，1969) ， 他 们 还 认为 即使 复杂 的 多 层 感 知 俘 也 不 见得 更 好 。 这 显然 不 会 
激励 人 去 研究 感知 器 ， 这 种 情况 导致 在 20 世纪 70 年 代 几 乎 所 有 的 人 工 智 能 研究 者 都 放弃 了 人 工 
神经 网 络 领 域 。 

在 20 世纪 80 年 代 ， 由 于 需要 像 大 脑 那样 进行 信息 处 理 ， 以 及 计算 机 技术 的 发 展 和 神经 科学 
的 进步 ， 神 经 网 络 领域 快速 复 办 了 。 在 几 个 前 沿 领域 , 科学 家 们 在 理论 和 设计 上 都 做 了 重大 页 
献 。Grossberg 创建 了 自 组 织 的 新 理论 (adaptive resonance theory， 自 适应 共振 理论 ) ， 这 为 一 种 新 
的 神经 网 络 芮 定 了 基础 ( Grossberg, 1980) Hopfield SE T AA bo BL] BJ AS ze, HJ 
Hopfield 网 络 (Hopfield networks, Hopfield, 1982), Æ 20 世纪 80 年 代 引 起 了 广泛 关注 。Kohonen 
发 表 了 一 篇 关于 目 组 织 映 射 的 文章 (Kohonen，1982 ) Barto, Sutton 和 Anderson 发 表 了 关于 增强 
学 习 (reinforcement learning) 和 在 控制 领域 的 应 用 的 文章 (Barto et al. ，1983 ) 。 但 真正 的 突破 
是 在 1986 ^E, Rumelhart 和 McClelland 在 《并 行 分 布 式 处 理 : 对 认 知 微 结构 的 探索 》 一 文中 ， 重 
新 提出 了 反 向 传播 学 习 算 法 (back- propagation learning algorithm ) ( Rumelhart and McClelland, 
1986) ， 这 一 算法 由 Bryson 和 Ho 在 1969 年 首次 提出 (Bryson and Ho, 1969) , Parker (Parker, 
1987) 和 LeCun (LeCun, 1988) 在 同一 时 间 也 提出 了 反问 传播 学 习 算法 ， 从 此 这 一 算法 成 为 用 
于 训练 多 层 感 知 需 的 最 流行 的 技术 。 在 1988 年 ，Broomhead 和 Lowe HEE T fi Fl fe m dE PRO TY 
多 层 前 锁 网 络 的 程序 ， 这 是 多 层 感 知 硕 的 蔡 代 (Broomhead and Lowe, 1988) 。 

从 McCulloch 和 Pitts 提出 的 早期 模型 ， 发 展 为 根植 于 神经 科学 、 心 理学 、 数 学 和 工程 的 交叉 
学 科 ， 人 工 神经 网 络 经 过 了 一 个 瘟 长 的 历程 ， 并 在 理论 和 应 用 两 方面 还 会 继续 发 展 。 无 论 如 何 ， 
对 于 20 世纪 80 年 代 神 经 网 络 的 重生 ，Hopfield 的 文章 (Hopfield, 1982) , Rumelhart 和 McClel- 
land 的 书 ( Rumelhart and McClelland, 1986) 具有 最 重要 、 最 具 影响 的 意义 。 
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1.2.6 进化 计算 ， 在 尝试 中 学 习 (20 世纪 70 年 代 早 期 至 今 ) 


目 然 界 的 智能 是 进化 的 产物 。 因 此 ， 通 过 模拟 生物 进化 ， 我 们 有 希望 找 出 将 现 有 的 系统 推 癌 
高 水 平 智能 的 方法 。 目 然 界 是 在 答 试 中 学 习 的 ， 并 没有 外 界 告 诉 生 物 系统 如 何 适 应 具体 环境 ， 这 
是 物 苑 天 择 的 过 程 。 适 应 性 最 强 的 物种 更 有 机 会 蛇 衍 ， 并 将 基因 遗传 给 下 一 代 。 

人 工 智能 中 的 进化 方法 是 基于 目 然 选择 和 遗传 的 计算 模型 。 进 化 计算 的 工作 流程 包括 模拟 
由 个 体 组 成 的 种 群 、 评 估 个 体 性 能 、 产 生 下 一 代 种 群 ， 这 一 过 程 需 要 迭代 奢 干 次 。 

进化 计算 主要 包括 3 个 主要 技术 : 遗传 算法 、 进 化 策略 以 及 遗传 编程 。 

遗传 算法 是 John Holland Æ 20 世纪 70 年 代 早 期 提出 的 (Holland，1975 ) 。 他 设计 了 一 个 包 
括 选 择 、 交 又 、 变 异 3 个 遗传 操作 的 算法 ， 用 于 操纵 人 工 “ 染 色 体 ” (表达 为 二 进 制 字符 串 ) 。 
模式 定理 是 遗传 算法 的 坚实 的 理论 基础 (Holland, 1975; Goldberg, 1989) 。 

在 Holland 的 遗传 算法 之 前 ， 早 在 20 世纪 60 年 代 早 期 ， 两 个 来 自 相 林 科技 大 学 的 学 生 Ingo 
Rechenberg 和 Hans- Paul Schwefel 提出 了 一 个 新 的 名 为 进化 策略 (evolutionary strategies) 的 优化 方 
法 (Rechenberg，1965) 。 进 化 策略 的 具体 任务 是 解决 工程 设计 中 的 参数 优化 问题 。Rechenberg 
和 Schwefel 建议 ， 像 自然 界 变 异 那样 对 参数 随机 变化 。 事 实 上 ， 可 将 进化 策略 方法 视 为 工程 师 直 
觉 的 蔡 代 物 。 进 化 琳 略 使 用 一 种 数值 优化 过 程 ， 类 似 于 绽 符 : 卡 党 搜索 方法 。 

遗传 算法 和 进化 荣 略 都 可 以 解决 广泛 的 问题 。 这 两 个 方法 为 之 前 根本 无 法 解决 的 蜗 度 复杂 
的 非 线 性 搜索 和 优化 问题 提供 了 健壮 、 可 徘 的 解决 方案 (Holland, 1995; Schwefel, 1995), 

遗传 编程 代表 了 将 学 习 式 的 遗传 模型 在 程序 设计 中 的 应 用 ， 它 的 目的 并 不 是 推出 问题 的 编码 表 
示 ， 而 是 推出 用 以 解决 问题 的 计算 机 代码 。 就 是 说 ， 遗 传 编程 的 目的 是 产生 解决 问题 的 计算 机 程序 。 

20 世纪 90 年 代 John Koza 的 工作 极 大 促进 了 人 们 对 遗传 编程 的 兴趣 (Koza, 1992; 1994), 
他 使 用 遗传 算 子 来 操纵 表示 LISP 程序 的 符号 码 。 遗 传 编程 为 计算 机 科学 领域 的 主要 问题 提供 了 
解决 方案 ， 使 计算 机 不 需 通 过 精确 编程 就 能 解决 问题 。 

遗传 算法 、 进 化 策略 和 壮 传 编程 标志 看 人 工 智 能 学 科 的 快速 成 长 ， 并 且 具 有 巨大 的 发 展 空间 。 


1.2.7 知识 工程 的 新 纪元 ， 文 字 计算 (20 世纪 80 年 代 后 期 至 今 ) 


与 基于 符号 推理 的 系统 相 比 ， 神 经 网 络 的 技术 提供 了 与 现实 世界 更 加 自然 的 交互 。 神 经 网 
能 够 学 习 、 适 应 问题 环境 的 变化 ， 能 在 规则 未 知 的 情形 下 构建 模式 ， 并 能 处 理 模糊 、 不 完整 的 
信息 。 但 是 神经 网 络 的 解释 功能 差 ， 像 黑匣子 一 样 工 作 。 用 现 有 的 技术 来 训练 神经 网 络 很 耗 时 ， 
而 且 频 繁 的 重新 训练 还 会 导致 严重 的 困难 。 

尽管 在 一 些 特殊 的 环境 ， 尤 其 是 缺少 知识 的 环境 中 ， 人 工 神经 网 络 能 比 专家 系统 更 好 地 解 
决 问题 ， 但 这 两 个 技术 发 展 到 现在 已 不 再 彼此 竞争 ， 而 是 互补 。 

传统 的 专家 系统 很 适用 于 具有 精确 输入 和 逻辑 输出 的 封 财 式 系统 的 应 用 。 这 类 系统 使 用 表 
达 为 规则 形式 的 专家 知识 ， 必 要 时 还 可 以 与 用 户 交 互 以 构建 特定 的 事实 。 这 类 系统 的 主要 缺点 
在 于 人 类 专家 并 不 总 能 用 规则 表达 知识 或 逐条 解释 推理 ， 从 而 会 妨碍 专家 系统 积累 必需 的 知识 ， 
最 终 导 致 失败 。 为 了 克服 这 个 缺陷 ， 可 使 用 神经 计算 从 大 数据 集中 抽取 隐 含 的 知识 以 获取 专家 
系统 的 规则 (Zahedi, 1993; Medsker and Leibowitz, 1994) 。 在 传统 的 基于 规则 的 专家 系统 中 也 
可 以 使 用 人 工 神 经 网 络 来 校正 规则 (Omlin and Giles，1996 ) 。 换 句 话 说 ， 当 得 到 的 知识 不 完整 
时 ， 可 以 用 神经 网 络 精炼 知识 ， 当 知识 与 给 定 的 数据 不 一 致 时 ， 可 使 用 神经 网 络 修改 规则 。 

另 一 个 非常 重要 的 技术 是 模糊 逻辑 ， 用 于 处 理 模糊 、 不 精确 、 不 确定 的 知识 和 数据 。 传 统 的 
专家 系统 中 ， 用 于 处 理 不 精确 数据 的 大 部 分 方法 都 是 基于 概率 论 思 想 ， 如 MYCIN 就 引入 了 确信 
KF, PROSPECTOR 则 使 用 了 贝 叶 斯 规则 来 传送 不 确定 性 。 不 过 ， 专 家 们 并 不 总 是 使 用 概率 值 ， 
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而 会 使 用 “常常 、 一 般 地 、 有 时 、 偶 尔 、 极 少 ” 之 类 的 术语 。 模糊 逻 辑 正 是 关于 模糊 值 使 用 的 
方法 ,模糊 值 用 于 理解 单词 含义 、 人 类 推理 、 制 定 决 岳 。 模 糊 逻 辑 以 能 精确 反映 专家 对 复杂 难题 
的 理解 的 形式 ， 对 人 类 知识 进行 编码 和 应 用 ， 从 而 为 打破 传统 专家 系统 的 计算 瓶 祷 提供 了 一 个 
可 行 的 方法 。 

模糊 逻辑 的 核心 在 于 语言 变量 这 一 概念 。 语 言 变量 的 值 是 文字 ， 而 不 是 数值 。 模 类 系统 使 用 
IF- THEN 规则 来 体现 人 类 知识 ， 这 点 与 专家 系统 类 似 ， 只 是 模糊 系统 的 规则 是 模糊 的 ， 例 如 : 

IF speed is high THEN stopping_distance is long 























IF speed is low THEN stopping_distance is short 

模糊 逻辑 或 模糊 集 理论 是 由 加 州 大 学 伯克利 分 校 电子 工程 系 主任 Lotfi Zadeh 教授 在 1965 年 
提出 的 (Zadeh，1965 ) ， 它 提供 了 一 种 采用 文字 进行 计算 的 方法 。 然 而 ， 模 糊 集 理 论 被 技术 团体 
接受 的 过 程 却 很 困难 和 漫长 ， 部 分 原因 在 于 具有 争议 的 名 字 “ 模 糊 ”， 这 个 名 字 似 乎 太 随意 而 难 
以 被 认真 对 待 。 模 糊 理论 虽然 在 西方 被 忽视 ， 却 在 东方 的 日 本 被 接纳 了 。 目 1987 年 起 ,模糊 理 
论 被 成 功 地 应 用 在 日 本 人 设计 的 洗 硕 机 、 洗 衣 机 、 空 调 、 电 视 机 、 复 印 机 和 汽车 上 。 

模糊 产品 的 出 现 使 得 这 一 看 似 新 弧 而 在 30 E ESL e t B IN Se SUCK dE, AER ET BS 
书籍 和 学 术 论 文 相继 诞生 。 一些 经 典 著 述 包 括 :《Fuzzy Sets, Neural Networks and Soft Computing 》 
(Yager and Zadeh, eds, 1994); (The Fuzzy Systems Handbook) (Cox, 1999); (Fuzzy Engineer- 
ing) (Kosko, 1997); (Expert Systems and Fuzzy Systems) (Negoita, 1985); IRP (Fuzzy 
Thinking) (Kosko, 1993) ， 这 本 书 对 模糊 逻辑 进行 了 普及 性 介绍 。 

模糊 逻辑 主要 应 用 在 控制 工程 领域 。 不 过 ,模糊 控制 系统 仅 使 用 了 模糊 逻辑 知识 表达 的 一 
小 部 分 功能 。 模 糊 逻 辑 在 基于 知识 的 系统 和 决策 文 持 系统 中 的 应 用 优势 可 归纳 如 下 (Cox, 
1999; Pedrycz and Gomide, 2007; Turban el al. , 2010) : 

e 提高 了 计算 能 力 。 基 于 规则 的 模糊 系统 比 传 统 专家 系统 运算 快 ， 需 要 的 规则 也 少 。 模 糊 专 
家 系统 通过 合并 规则 使 系统 功能 更 强 。Lotfi Zadeh 认为 用 不 了 几 年 ， 多数 专家 系统 都 将 使 
用 模糊 逻辑 来 解决 高 度 非 线 性 问题 和 计算 困难 的 问题 。 
改善 了 认 知 模型 。 模 糊 系 统 允 许 以 能 反映 专家 思考 复 洒 问题 的 形式 对 知识 编码 。 专 家 在 思 
考 复杂 问题 时 ,会 用 到 不 精确 术语 ， 例 如 高 和 低 、 快 和 慢 、 轻 和 重 ， 也 用 使 用 术语 常常 和 
几乎 不 、 通 常 和 很 少 、 频 繁 和 偶尔 。 在 建立 传统 的 规则 时 ， 需 要 对 术语 定义 严格 的 界限 ， 
这 就 把 专业 知识 分 解 成 了 知识 片段 。 当 传统 的 专家 系统 面 对 高 度 复杂 问题 时 ， 知 识 片 段 将 
导致 系统 性 能 低下 。 相 反 地 ， 模糊 专 家 系统 通过 对 不 精确 信息 建 模 ， 束 能 以 更 接近 专家 思 
考 的 方式 捕捉 专业 知识 ， 从 而 改善 了 系统 的 认 知 建 模 。 
能 够 表达 多 个 专家 。 传 统 的 专家 系统 建立 在 非常 狭窄 的 、 被 明确 定义 的 专业 知识 领域 ， 系 
统 性 能 完全 依赖 于 能 否 正 确 选 择 专家 。 尺 省 一 般 的 策略 是 只 选 定 一 个 专家 ,但 是 当 构 造 更 
复 森 的 专家 系统 或 专业 知识 不 能 被 较 好 地 定义 时 ， 就 需要 多 个 专家 。 多 个 专家 能 够 扩展 领 
Ak». 综合 经 验 ， 并 且 避 人 免 了 对 顶级 专家 的 依赖 ， 顶 级 专家 一 般 费 用 昂 吐 有 旦 难以 联系 到 。 不 
过 ， 多 个 专家 极 难 达 成 一 臻 意见， 他们 的 意见 稼 篆 不 同 甚 至 有 冲突 。 在 经 济 和 管理 领域 ， 
当 没 有 简单 方案 而 又 需 考虑 各 种 具有 冲突 的 观点 时 尤其 如 此 。 模 糊 专家 系统 有 助 于 表达 意 
见 相 左 的 多 个 专家 的 专业 知识 。 

尽管 模糊 系统 允许 以 更 自然 的 方式 表达 专家 知识 ， 但 是 它们 仍 依赖 来 自 专家 提炼 的 规则 ， 
因而 系统 有 聪明 的 ， 也 有 和 牢 拙 的 。 有 些 专 家 能 够 提供 非常 聪明 的 模糊 规则 ， 有 些 专 家 只 会 猜测 或 
提供 错误 的 规则 。 所 以 ， 所 有 的 规则 必须 经 过 测试 、 调 整 ， 这 一 过 程 可 能 会 漫长 又 乏味 。 例 如 ， 
日 立 公 司 的 工程 师 们 用 了 好 几 年 时 间 才 测试 、 调 整 了 仙人 台地 铁 系 统 上 的 54 条 模糊 规则 。 

信 助 模糊 逻辑 开发 工具 ， 能 够 轻松 地 构造 出 一 个 简单 的 模糊 系统 ， 但 之 后 很 可 能 要 花费 几 
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天 、 几 个 星期 甚至 几 个 月 来 测试 新 规则 并 调整 系统 。 怎 样 加 快 这 个 过 程 呢 ? 或者， 走样 目 动产 生 
好 的 模糊 规则 呢 ? 

近年 来 ， 一 些 基 于 神经 网 络 技术 的 方法 已 被 用 于 在 数值 效 据 中 寻找 模糊 规则 。 目 适应 或 神 
经 -模糊 系统 能 够 发 现 新 的 模糊 规则 ， 或 者 基于 提供 的 数据 来 调整 已 有 的 规则 。 换 言 之 ， 即 是 输 
入 数据 -输出 规划， 或 者 输入 经 验 - 输出 规律 。 

那么 知识 工程 将 回 什 么 方 回 发 展 呢 ? 

专家 系统 、 神 经 系统 和 模糊 系统 目前 已 经 成 熟 ， 并 被 广 沁 应 用 于 多 个 领域 处 理 不 同 问题 ， 主 
要 在 工程 、 医 药 、 人 金融、 商业 和 管理 等 领域 。 各 个 技术 在 处 理 人 类 知识 的 不 确定 性 和 模糊 性 上 痢 
各 有 方法 ,在 知识 工程 领域 都 占有 一 席 之 地 。 这 3 个 技术 之 间 不 再 苑 争 ， 而 是 互相 配合 。 在 专家 
系统 中 融入 棕 糊 逻辑 和 神经 计算 ， 能 够 提高 基于 知识 系统 的 日 适应 性 、 鲁 棒 性 、 容 错 能 力 和 运算 
速度 。 此 外 ， 利 用 文字 进行 计算 使 得 系统 更 加 “人 性 化 ” 。 在 构造 智能 系统 时 ， 使 用 现 有 理论 而 
非 提 出 新 理论 已 成 为 惯例 。 应 用 目标 也 不 再 限于 简单 的 小 问题 ， 而 是 实在 的 现实 问题 。 


1.3 小 结 

我 们 处 在 知识 革新 的 时 代 ， 在 这 个 时 代 ， 一 个 国家 的 实力 不 是 由 军队 的 士兵 数量 来 决定 ， 而 
是 由 这 个 国家 所 拥有 的 知识 来 决定 。 和 科学、 医药、 工程 和 商业 一 方面 推动 着 国家 朝 更 高 质量 的 生 
活 发 展 ， 一 方面 也 需要 高 素质 的 人 人。 当前 我 们 已 开始 使 用 智能 机 器 从 知识 渊博 的 人 身上 获取 经 
验 知 识 ， 并 证 机 顺 像 人 那样 进行 推理 。 

在 第 一 台 计 算 机 发 明之 前 ， 对 智能 机 需 的 海 求 仅仅 是 一 个 涵 茫 的 梦 。 虽 然 早 期 的 计算 机 按 
照 特 定 的 算法 能 够 有 效 操作 大 型 数据 库 ， 却 不 能 对 提供 的 信息 进行 推理 ， 因 而 引发 了 计算 机 能 
否 思考 的 问题 。 阿 兰 . 图 灵 将 计算 机 的 智能 行为 定义 为 在 认 知 任务 中 达到 人 类 同等 水 平 的 能 
图 灵 测 试 为 基于 知识 的 系统 提供 了 检验 和 验证 的 基础 。 

1956 年 ， 在 达 特 茅 斯 学 院 召 开 的 里 期 研讨 会 将 10 个 对 机 需 智 能 感 兴趣 的 研究 者 聚 到 了 一 
起 ， 一 门 新 学 科 一 人 工 智能 诞生 了 。 

自从 20 世纪 50 年 代 早 期 ， 人 工 智能 技术 从 个 别 研究 者 的 好 奇 开 始 ， 发 展 为 帮助 人 类 决策 的 
有 价值 的 工具 。 从 20 世纪 60 年 代 关 于 人 工 智能 的 伟大 幻想 和 期 待 ， 到 20 世纪 70 年 代 早 期 对 人 
工 智能 的 纪 灭 和 资助 削减 ; 从 20 世纪 70 年 代 的 第 一 代 专 家 系统 的 开发 ， 如 DENDRAL, MYCIN 
和 PROSPECTOR, 2!) 20 世纪 八 九 十 年 代 专 家 系统 的 成 熟 以 及 在 不 同 领 域 的 广泛 应 用 ; 从 20 世纪 
40 年 代 所 提 的 简单 的 二 进 制 神经 元 模型 ， 到 20 世纪 80 年 代 人 工 神 经 网 络 的 戏剧 性 复活 ; 从 20 
世纪 eo 年 代 所 提出 的 模糊 集 理论 在 西方 被 忽视 ， 到 20 世纪 80 年 代 由 日 本 提供 的 大 量 的 “模糊 
型 ”消费 品 ， 以 及 20 世纪 90 年 代 软 计算 和 用 文字 计算 被 全 世界 接受 ; 这 些 事件 使 我 们 看 到 了 人 
工 智能 的 历史 性 发 展 周期 。 

专家 系统 的 发 展 创立 了 知识 工程 ， 它 是 一 种 构建 智能 系统 的 过 程 。 如 今 知 识 工程 不 仅 涉及 
专家 系统 ， 还 涉及 神经 网 络 和 模糊 逻辑 。 知 识 工程 仍然 是 一 门 艺术 ， 而 非 工程 ， 但 人 们 已 经 尝试 
使 用 神经 网 络 技术 从 数值 数据 中 自动 抽取 规则 。 

表 1.1 总 结 了 人 工 智 能 和 知识 工程 发 展 历程 中 的 关键 事件 ， 涵 善 范围 从 1943 Æ McCulloch 和 
Pitts 在 人 工 智 能 上 的 初次 尝试 ， 到 近年 来 的 用 文字 计算 的 基于 知识 的 系统 中 将 专家 系统 、 模 糊 逻 
辑 和 神经 计算 进行 合并 ， 从 而 各 取 所 长 。 

本 章 的 主要 内 容 包 括 : 

e 知 能 是 指 学 习 和 理解 问题 、 解 决 问题 、 制 定 决 策 的 能 

e 人 工 智能 是 使 机 器 像 人 那样 用 智能 做 事 的 一 门 学 科 。 

e 如 果 机 器 在 某 些 认 知 任务 中 能 达到 人 类 同等 水 平 ， 它 就 是 智能 机 器 。 在 建造 智能 机 器 时 ， 
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我 们 必须 捕 提 、 组 织 和 使 用 特定 问题 领域 的 人 类 专家 知识 。 

e 必须 严格 限制 智能 机 和 从 的 问题 域 ， 对 此 的 硝 认 标 志春 人 工 智能 从 泛 化 的 、 知 识 稀 蕊 的 允 方 法 回 
具体 领域 的 知识 密集 型 方法 的 重大 “范式 转移 ”。 这 一 转移 促成 了 专家 系统 的 发 展 ， 从 而 使 计 
算 机 程序 的 性 能 在 狭 罕 问题 领域 达到 人 类 专家 水 平 。 专 家 系统 以 特定 规则 的 形式 使 用 人 类 知识 
和 经 验 ， 主 要 特征 表现 在 对 知识 和 推理 机 制 的 明确 划分 。 专 家 系统 更 能 解释 推理 过 程 。 


表 1.1 人 工 智能 和 知识 工程 发 展 历程 中 主要 事件 一 览 





时 期 主要 事件 
McCulloch and Pitts, A Logical Calculus of the Ideas Immanent in Nervous Activity, 1943 
人 工 智能 的 诞生 Turing, Computing Machinery and Intelligence, 1950 
AH E H 


(1943 4F ~ 1956 年 ) 


电子 数据 集成 融和 计算 需 项 目 (von Neumann) 
Shannon, Programming a Computer for Playing Chess, 1950 
TES RE eT BATA La BE. ATANA A SC eT Ze, 1956 








LISP ( McCarthy) 





ATA RE RM 通用 问题 解决 方案 (GPR) 项 目 ( Newell and Simon) 
(1956 年 ~ 20 世纪 
60 年 代 晚 期 ) Newell and Simon, Human Problem Solving , 1972 
Minsky, A Framework for Representing Knowledge, 1975 
人 工 智能 的 幻灭 Cook, The Complexity of Theorem Proving Procedures, 1971 
(20 世纪 60 年 代 晚 期 ~ Karp, Reducibility Among Combinatorial Problems, 1972 
20 世纪 70 年 代 早 期 ) Lighthill 报告 , 1971 
DENDRAL (Feigenbaum, Buchanan and Lederberg， 斯 坦 福 大 学 ) 
—"—— : MYCIN (Feigenbaum and Shortliffe， 斯 坦 福 大 学 ) 
专家 系统 的 发 明 PROSPECTOR (斯 坦 福 大 学 研究 院 ) 
(20 世纪 70 年代 于 期 ~ | PROLOG 一. 种 逻辑 编程 语言 (Col 和 
20 世纪 80 年 代 中 期 ) pul tla ri (Colmerauer, Roussel and Kowalski, France 
EMYCIN (斯 坦 福 大 学 ) 
Waterman, A Guide to Expert Systems, 1986 
Hopfield, Neural Networks and Physical Systems with Emergent Collective Computational 
Abilities , 1982 
人 工 神经 网 络 的 重生 Kohonen, Self- Organized Formation of Topologically Correct Feature Maps, 1982 
(20 世纪 80 年 代 Rumelhart 和 McClelland, Parallel Distributed Processing, 1986 
中 期 至 今 ) 首届 IEEE 神经 网 络 国 际会 议 


进化 计算 (20 世纪 
70 年 代 早 期 至 今 ) 





用 文字 计算 
(20 世纪 80 年 代 
晚期 至 今 ) 





Haykin, Neural Networks, 1994 
神经 网 络 ，MATLAB 应 用 工具 箱 (The MathWorks, Inc. ) 


Rechenberg, Evolutionsstrategien - Optimierung Technischer Systeme Nach Prinzipien der Biologischen 
Information , 1973 

Holland, Adaptation in Natural and Artificial Systems, 1975 

Koza, Genetic Programming; On the Programming of the Computers by Means of Natural Selection , 
1992 

Schwefel, Evolution and Optimum Seeking , 1995 

Fogel, Evolutionary Computation-Towards a New Philosophy of Machine Intelligence, 1995 


Zadeh, Fuzzy Sets, 1965 
Zadeh, Fuzzy Algorithms , 1969 
Mamdani, Application of Fuzzy Logic to Approximate Reasoning Using Linguistic Synthesis, 1977 
Sugeno, Fuzzy Theory, 1983 
HAY "Eu" i$ (WEBDL, VEAL, 38. HALL, ENHL) 
仙人 台地 铁 系 统 (日 立 公 司 , AA), 1986 
Negoita, Expert Systems and Fuzzy Systems, 1985 
首届 IEEE 神经 系统 国际 会 议 ，1992 ， 
Kosko, Fuzzy Thinking , 1993 
Yager and Zadeh, Fuzzy Sets, Neural Networks and Soft Computing , 1994 
Cox, The Fuzzy Systems Handbook, 1994 
Zadeh, Computing with Words-A Paradigm Shift, 1996 
模糊 逻辑 ,MATLAB 工具 箱 (The MathWorks, Inc. ) 
神经 网 络 , MATLAB 工具 箱 (The MathWorks, Inc. ) 
伯克利 软 计算 倡议 组 织 
(BISC) http: //www-bisc. cs. berkeley. edu 
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e 构建 智能 机 上 需 面 临 的 主要 问题 是 知识 获取 瓶颈 ， 即 从 人 类 专家 那里 获取 知识 ， 这 也 是 知识 
工程 的 主要 问题 。 

e 专家 在 思考 时 会 使 用 不 精确 的 术语 ， 如 常常 和 几乎 不 、 通 常 和 很 少 、 频 繁 和 偶尔 ， 也 会 使 
用 语言 变量 ， 如 高 和 低 、 快 和 慢 、 轻 和 重 。 模 糊 逻 辑 或 模糊 集 理论 为 用 文字 进行 计算 提供 
了 方法 。 模 糊 逻 辑 的 重心 是 使 用 模糊 值 ， 以 捕捉 和 理解 文字 含义 、 人 类 的 推理 和 决策 的 制 
定 ， 并 为 传统 专家 系统 在 计算 上 的 负担 问题 提供 了 突破 性 的 方法 。 

e 专家 系统 既 不 能 通过 经 验 学 习 、 也 不 能 通过 经 验 自 我 完善 ， 多 由 个 人 开发 ， 后 续 发 展 也 需 
要 巨大 的 投入 ， 即 使 构建 中 型 专家 系统 也 需要 5 ~ 10 人 年 。 机 可 学 习 则 大 大 加 快 了 专家 系 
统 的 开发 进程 ， 通 过 加 入 新 规则 或 校正 已 有 规则 ， 也 提高 了 知识 的 质量 。 

e 人 工 神 经 网 络 启发 于 生物 学 上 的 神经 网 络 ， 基 于 历史 事件 进行 学 习 ， 并 能 上 自动 生成 规则 ， 
由 此 避免 了 宛 长 、 昂 贵 的 知识 获取 过 程 ， 以 及 相应 的 验证 、 调 整 过 程 。 

e 通过 对 专家 系统 、 人 工 神经 网 络 分 别 与 模糊 逻辑 的 集成 ， 提 高 了 基于 知识 的 系统 的 自 适 应 
性 、 容 错 能 力 和 运算 速度 。 
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何 为 智能 ?什么 是 机 带 的 智能 行为 ? 

描述 人 工 智能 中 的 图 灵 测 试 ， 并 从 现代 的 角度 证 明 它 的 有 效 性 。 

如 何 定 义 人 工 智能 这 门 科 学 ” 人 工 智能 何 时 诞生 ? 

什么 是 弱 方 法 ?列举 20 世纪 70 年 代 早 期 AI 幻灭 的 主要 原因 。 

何 为 专家 系统 ? 蜀 方 法 和 专家 系统 技术 的 主要 区 别 是 什么 ”? 

列举 DENDRAL, MYCIN 和 PROSPECTOR 这 些 早期 专家 系统 的 共同 特征 。 
专家 系统 的 局 限 性 有 哪些 ? 

专家 系统 和 人 工 神经 网 络 之 间 的 区 别 是 什么 ? 

人 工 神 经 网 络 在 20 世纪 80 年 代 复 活 的 原因 是 什么 ? 











. 10 ”模糊 逻辑 的 建立 前 提 是 什么 ? 模糊 集 理论 是 何 时 出 现 的 ? 
.11 
12 合并 专家 系统 、 模 糊 逻 辑 和 神经 计算 的 系统 会 有 哪些 优势 ? 


在 基于 知识 的 系统 中 应 用 模糊 逻辑 的 主要 优势 是 什么 ? 
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本 章 介绍 构建 知识 系统 的 常用 选择 : 基于 规则 的 专家 系统 。 


2.1 知识 概述 


在 20 世纪 70 年 代 ， 人 们 最 终 意识 到 ， 要 用 机 融 解 决 智能 问题 ， 就 必须 先知 道 方案 。 也 就 是 
说 ， 人 必须 具备 特定 领域 的 知识 ， 知 道 如 何 做 。 

知识 是 什么 

知识 是 对 于 一 个 主题 或 一 个 领域 在 理论 或 实践 上 的 理解 ， 也 是 所 有 已 知 的 总 和 ， 显 然 ， 知 识 
就 是 力量 。 那 些 拥有 知识 的 人 称 为 专家 ， 他 们 是 所 在 组 织 中 重要 的 人 物 。 任 何 一 个 成 功 运 营 的 公 
司 都 有 奋 干 一 流 的 专家 ， 没 有 他 们 公司 就 无 法 运营 下 去 。 

谁 可 称 为 专家 

任何 一 个 人 如 果 在 特定 领域 有 深厚 的 知识 (表现 在 事实 和 规则 两 方面 ) 和 强大 的 实践 经 验 ， 
都 被 认为 是 领域 专家 。 和 领域 的 范围 有 所 限制 。 例 如 ， 发 电机 专家 也 许 对 变 压 需 仅 有 泛泛 的 了 解 ， 
人 寿 保险 专家 或 许 对 不 动产 保险 政策 的 了 解 也 是 有 限 的 。 总 之 ， 专 家 能 误 练 地 做 别人 做 不 了 的 
事情 。 

专家 如 何 思考 

人 类 的 思维 活动 是 内 在 的 、 复 杂 的 ， 用 算法 表达 不 了 。 好 在 多 数 专家 能 以 规则 的 形式 表达 知 
识 ， 从 而 解决 问题 。 举 一 个 简单 的 例 和 于 ， 假 设 你 遇 到 一 个 外 星人 ， 他 想 过 马路 。 你 是 否 帮 得 了 
fi? 因为 有 多 年 过 马路 的 经 历 ， 这 一 方面 你 是 专家 。 所 以 你 有 能 力 就 此 教 外 星人 。 你 会 怎么 
做 呢 ? 

你 可 以 告诉 外 星人 ， 当 交通 灯 变 绿 时 ， 可 以 安全 地 过 马路 ， 当 交通 灯 变 红 时 ， 就 必须 停止 。 
这 是 基本 规则 。 可 以 把 你 的 知识 简单 地 表达 为 如 下 句子 : 


IF the ‘traffic light’ is green 
THEN the action is go 
































IF the 'traffic light' is red 
THEN the action is stop 


这 些 用 下 -THEN 表达 的 句子 称 为 产生 式 规则 或 规则 。 在 人 工 智能 学 科 中 ,规则 是 最 常用 的 
知识 表达 的 方式 ， 可 以 定义 为 IF-THEN 语句 ，IF 部 分 是 给 定 的 信息 或 事实 ，THEN 部 分 则 是 相 
应 的 行为 。 规 则 用 于 描述 如 何 解决 问题 ， 创 建 简单 ， 也 易于 理解 。 


2.2 知识 表达 技术 一 一 规则 

任何 规则 都 包括 两 部 分 ，IF 部 分 和 THEN 部 分 。IF 部 分 是 前 项 (前 提 或 条 件 )，THEN 部 分 
是 后 项 (结论 或 行为 ) 。 

规则 的 基本 语法 是 : 


IF < Ay > 
THEN < 后 项 > 


一 般 而 言 ， 规 则 可 以 有 多 个 前 项 ， 这 些 前 项 用 关键 词 AND ( 合 取 ) OR ( 析 取 ) 或 者 AND、 
OR 混合 使 用 。 不 过 ， 最 好 在 同一 个 规则 中 避免 混合 使 用 合 取 和 析 取 。 
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OR 
THEN 


规则 的 结论 部 分 也 可 以 由 多 个 从 句 组 成 : 


IF 
THEN 


< 前 项 1> 
< 前 项 2> 


< 前 项 n> 
< 结论 > 
< 前 项 1> 


< 前 项 2> 


< 前 项 n> 
“结论 > 


< 前 项 > 
< 结论 1> 
< 结论 2> 


< 绪论 m> 
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规则 的 前 项 部 分 包括 两 部 分 对象 (语言 对 象 ) 和 值 。 以 过 马路 为 例 ， 语 言 对 象 是 “交通 
灯 ”"， 可 以 取 值 “ 绿 ” 或 “ 红 "。 对 象 和 值 用 操作 符 连 接 。 操 作 符 识别 对 象 并 进行 赋值 。 像 is、 
are, is not, are not 等 操作 符 为 语言 对 象 赋予 符号 值 。 在 专家 系统 中 ， 也 可 以 使 用 数学 操作 符 定 
义 数值 型 对 象 ， 并 赋予 数值 。 例 如 : 


IF 
AND 


THEN ‘signature of the parent’ is required 
规则 的 后 项 部 分 与 前 项 部 分 类 似 ， 也 通过 操作 





‘age of the customer’ < 18 
‘cash withdrawal’ > 1000 





PERT ARAM BEFANA OT EL, DÀ 


过 马路 为 例 ， 如 果 “ 交 通 灯 ”的 值 是 “ 绿 ”， 第 一 条 规则 会 将 语言 对 象 的 行为 赋值 为 “前 进 ”。 


后 项 中 也 可 以 用 数值 型 对 象 和 简单 的 算术 表达 式 : 


IF 
THEN 


RAR 
关系 


IF 
THEN 


建议 


‘taxable income’ > 16283 


‘Medicare levy’ = ‘taxable income’ « 1.5 / 100 





建议 、 指 示 、 策 略 和 局 发 式 方法 也 可 以 用 规则 表达 : 


the ‘fuel tank’ is empty 
the car is dead 


the season is autumn 

the sky is cloudy 

the forecast is drizzle 

the advice is ‘take an umbrella’ 


the car is dead 
the ‘fuel tank’ is empty 
the action is ‘refuel the car’ 


the car is dead 
the action is ‘check the fuel tank’; 
stepl is complete 


step1 is complete 

the ‘fuel tank’ is full 

the action is ‘check the battery’; 
step2 is complete 
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局 发 式 方法 

IF the spill is liquid 

AND the ‘spill pH’ < 6 

AND the ‘spill smell’ is vinegar 

THEN the 'spill material' is 'acetic acid' 


2.3 专家 系统 研发 团队 的 主要 参与 者 

当 人 类 专家 提供 了 知识 后 ， 我 们 就 能 够 把 知识 输入 计算 机 ， 期 待 着 在 特定 领域 的 计算 机 能 
够 做 一 个 智能 的 助手 ， 或 者 像 专家 那样 解决 问题 ， 并 希望 计算 机 能 够 整合 新 知识 ， 并 以 易 读 、 易 
懂 的 方式 表达 知识 ,或 用 自然 语言 而 非 人 工 编程 语言 来 处 理 简 单 的 句子 。 最 后 ,我 们 还 希望 计算 
机 解释 得 出 一 个 结论 的 原因 。 换 言 之 ,我 们 需要 构建 专家 系统 一 一 能 在 锋 罕 问 题 领域 具有 专家 
水 平 的 计算 机 程序 。 

基于 规则 的 系统 是 最 常见 的 专家 系统 。 已 有 大 量 的 系统 被 成 功 应 用 于 商业 、 工 程 、 医 药 、 地 
理 、 电 力 系统 以 及 采矿 ， 也 有 很 多 公司 生产 和 销售 用 于 开发 基于 规则 的 专家 系统 的 软件 ， 即 个 人 
电脑 上 的 专家 系统 框架 。 

为 开发 基于 规则 的 系统 的 专家 系统 框架 越 来 越 普遍 ， 其 主要 优势 在 于 系统 开发 员 可 以 把 注 
意 力 放 在 知识 本 身 ， 而 不 是 学 习 一 门 编程 语言 。 

什么 是 专家 系统 框架 

专家 系统 框架 (expert system shell) 是 不 含 知 识 的 专家 系统 。 用 户 的 全 部 任务 就 是 以 规则 形 
式 加 入 知识 ， 并 提供 解决 问题 的 相关 数据 。 

现在 看 一 下 构建 专家 系统 需要 哪些 人 员 ， 这些 人 员 需 要 具备 什么 能 力 ? 

一 般 地 ， 专 家 系统 开发 团队 需要 5 个 成 
5i: 领域 专家 、 知 识 工程 师 、 程 序 员 、 项 目 经 
理 和 终端 用 户 。 专 家 系统 能 否 开 发 成 功 完全 取 
决 于 成 员 间 能 否 很 好 地 合作 。 图 2. 1 总 结 了 开 
发 团队 中 成 员 的 基本 关系 。 

领域 专家 是 在 特定 区 域 或 领域 具有 渊博 知 
识 和 丰富 经 验 的 人 。 他 们 在 特定 领域 具有 最 好 
的 经 验 ， 这 些 经 验 会 被 输入 到 专家 系统 中 。 所 
以 ， 专 家 必须 能 够 传达 知识 ， 乐 意 加 入 开发 团 
队 ， 并 在 项 目 上 有 足够 的 时 间 。 在 专家 系统 开 
发 团队 中 ， 领 域 专家 是 最 重要 的 成 员 。 图 2.1 专家 系统 开发 团队 的 主要 成 员 

知识 工程 师 是 善于 设计 、 构 建 、 测 试 专家 系统 的 人 ， 负 责 为 系统 选择 合适 的 任务 ， 并 就 如 何 
解决 特定 问题 和 领域 专家 进行 互动 。 通 过 互动 ， 知 识 工程 师 会 明确 专家 如 何 解 决 事实 和 规则 ， 以 
及 怎样 在 专家 系统 中 表达 。 继 而 选择 特定 的 开发 软件 或 专家 系统 框架 ， 或 选择 编程 语言 以 将 知 
识 编码 (有 时 知识 工程 师 亲 自 编 码 知 识 ) 。 之 后 ， 知 识 工程 师 负 责 测 试 、 修 改 专 家 系统 ， 并 将 系 
统 集成 到 工作 平台 。 可 以 看 出 ， 知 识 工程 师 要 负责 从 系统 的 最 初 设 计 到 最 终 运 行 的 整个 流程 。 项 
目 完 成 后 ， 也 许 还 要 参与 系统 的 维护 。 

程序 员 负 责编 程 ， 用 计算 机 能 接受 的 术语 描述 领域 知识 。 他 不 仅 需 要 精通 人 工 智 能 语言 的 
符号 编程 ， 像 LISP、PROLOG 和 OPSS 等 ,也 要 具备 不 同类 型 专家 系统 框架 的 应 用 经 验 。 此 外 ， 
程序 员 还 要 会 常用 编程 语言 ， 如 C、Pascal 、FORTRAN 和 Basic。 如 果 使 用 专家 系统 框架 进行 开 
发 ， 知 识 工 程 师 就 能 够 将 知识 编码 到 系统 中 ， 就 不 需要 程序 员 了 。 当 不 能 使 用 专家 系统 框架 时 ， 






































专家 系统 开发 团队 




































































ww ai bbt. com [] E] EL ET B] E]. E] 





第 2 章 基于 规则 的 专家 系统 - 19 











就 需要 程序 员 设 计 知 识 和 数据 表达 结构 (知识 库 和 数据 库 ) 、 控 制 结构 (推理 引擎 ) ， 以 及 对 话 
结构 (用户 界 面 )。 程 序 员 可 能 也 要 参与 测试 专家 系统 。 

项 目 经 理 是 开发 团队 的 领导 ， 负 责 项 目的 进程 ， 确 保 按 计划 进行 ， 并 与 专家 、 知 识 工程 师 、 
程序 员 、 终 端 用 户 进行 互动 。 

终端 用 户 ， 也 称 为 用 户 ， 是 使 用 专家 系统 的 人 ， 可 能 是 一 个 判定 火星 表面 土壤 的 化 学 结构 的 
分 析 化 学 家 (Feigenbaum et al. , 1971) ， 或 诊断 传染 性 血液 病 的 初级 医生 ( Shortliffe, 1976), 或 
勘探 新 矿床 的 勘探 地 质 学 家 (Duda et al. , 1979), ， 或 紧急 情况 下 需要 建议 的 电力 系统 操作 员 
(Negnevitsky, 2008) 。 这 些 终端 用 户 各 有 所 需 ， 所 以 系统 最 终 能 否 被 认可 依赖 于 用 户 的 满意 度 。 
用 户 的 满意 度 不 仅 包 括 系统 功能 ， 还 包括 操作 是 否 和 舒适 。 所 以 系统 中 用 户 界 面 的 设计 至 关 重 要 。 
因此 ， 终 端 用 户 的 建议 至 关 重 要 。 

当 聚 齐 5 个 成 员 时 ， 就 可 以 开发 系统 了 。 不 过 ， 现 在 的 许多 专家 系统 是 在 个 人 电脑 上 使 用 专 
家 系统 框架 开发 的 ， 不 需要 程序 员 ， 或 许 也 不 需要 知识 工程 师 。 对 于 微型 专家 系统 ， 项 目 经 理 、 
知识 工程 师 、 程 序 员 甚至 专家 可 能 是 同一 个 人 。 在 开发 大 型 专家 系统 时 ， 就 需要 上 述 所 有 的 成 


山村。 


2.4 基于 规则 的 专家 系统 的 结构 


在 20 世纪 70 年 代 早期 ， 来 目 卡 内 基 - 梅 隆 大 学 的 Newell 和 Simon 提出 了 产生 式 系 统 模型 ， 
为 现代 的 基于 规则 的 专家 系统 奠定 了 基础 (Newell and Simon, 1972) 。 产 生 式 模型 的 思路 是 ， 对 
于 一 个 用 相关 信息 表达 了 的 指定 问题 ， 人 类 运用 知识 (用 产生 式 规则 表达 ) 能 够 解决 。 产 生 式 
规则 存储 在 长 期 存储 人 右 中 ， 问 题 相 关 的 信息 或 事实 存储 在 短期 存储 器 中 。 图 2. 2 是 产生 式 系 统 模 
型 和 基于 规则 的 专家 系统 的 基本 结构 。 





















































知识 库 数据 库 
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a) 产生 式 系统 模型 b) 基于 规则 的 专家 系统 的 基本 结构 
图 2.2 产生 式 系 统 模型 和 基于 规则 的 专家 系统 的 基本 结构 


基于 规则 的 专家 系统 由 5 个 部 分 组 成 : 知识 库 、 数 据 库 、 推 理 引 擎 、 解 释 设 备 和 用 户 界 面 。 

知识 库 包含 解决 问题 相关 的 领域 知识 。 在 基于 规则 的 专家 系统 中 ， 知 识 用 一 组 规则 来 表达 。 
每 一 条 规则 表达 一 个 关系 、 建 议 、 指 示 、 策 略 或 启发 式 方法 ， 具 有 下 (RF) THEN (行为 ) 结 
构 。 当 规则 的 条 件 被 满足 时 ， 和 触发 规则 ， 继 而 执行 行为 。 

数据 库 包含 一 组 事实 ， 用 于 匹配 存储 在 知识 库 中 的 IE (条件 ) 部 分 。 

推理 引擎 执行 推理 ， 专 家 系统 由 此 找到 解决 方案 。 推 理 引擎 链接 知识 库 中 的 规则 和 数据 库 
中 的 事实 。 
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用 户 使 用 解释 设备 查看 专家 系统 怎样 得 出 解决 方案 的 过 程 ， 以 及 为 什么 需要 特定 事实 。 专 
家 系统 必须 能 够 解释 推理 并 证 明 所 给 的 建议 、 分 析 或 结论 。 

用 户 界面 是 实现 用 户 (查询 问题 解决 方案 ) 和 专家 系统 之 间 交 流 的 途径 ， 这 一 途径 必须 有 
实际 意义 并 尽 可 能 地 友好 。 

这 5 个 部 分 对 于 任何 基于 规则 的 专家 系统 来 说 都 是 不 可 或 缺 的 ， 它 们 共同 构成 了 专家 系统 的 
核心 ， 除 此 之 外 也 会 有 其 他 附加 组 件 。 

外 部 接口 允许 专家 系统 融合 外 部 数据 文件 和 
以 常用 语言 编写 的 程序 ， 如 C. Pascal, FORTRAN 
All Basic, Kl 2.3 是 基于 规则 的 专家 系统 的 完整 
结构 。 

开发 者 接口 一 般 包 括 知 识 库 编 辑 顺 、 调 试 工 知识 数据 库 
具 ， 以 及 输入 /输出 设备 。 [ sem armi 

FET 2 AR SUE TR zz Fe HE faj ERIT] SCR Zim Bt 
器 ， 用 于 输入 和 调整 规则 、 检 碍 格式 和 拼写 。 许 
多 专家 系统 也 包括 记录 设备 ， 用 于 监测 知识 工程 
师 或 专家 所 做 的 修改 。 如 宁 规 则 被 改动 ， 编 辑 需 
将 日 动 存储 改动 日 期 和 做 改动 的 人 ， 以 便 后 面 参 
考 。 当 有 多 个 知识 工程 师 和 专家 都 有 权 进 入 知识 
库 并 做 修改 时 ， 记 录 设 备 尤 其 重要 。 

调试 工具 一 般 包 含 跟 踪 设 备 和 断 点 包 。 跟 踪 
设备 提供 程序 执行 过 程 中 被 触发 的 规则 列表 。 使 
用 断 点 包 则 能 提前 告诉 系统 哪里 该 中 断 ， 以 备 知 
识 工 程 师 或 专家 即时 查看 数据 库 中 的 当前 值 。 

多 数 专家 系统 还 提供 输入 /输出 设备 ,例如 运 



































图 2.3 基于 规则 的 专家 系统 的 完整 结构 


行 时 知识 获取 器 ， 以 便 运 行 中 的 专家 系统 获取 数据 库 之 外 的 必需 信息 。 当 知识 工程 师 或 专家 输 


入 所 需 信息 后 ， 系 统 接着 往 下 运行 。 
总 之 ,开发 者 接口 、 知 识 获取 设备 使 得 领域 专家 能 够 二 接 将 知识 输入 专家 系统 ， 以 减少 打扰 
知识 工程 师 的 次 数 。 


2.5 专家 系统 的 基本 特征 


专家 系统 用 于 在 狭 罕 的 特定 领域 以 专家 级 的 水 平 解决 问题 。 因 此 ， 专 家 系统 的 最 主要 特征 
就 在 于 蜗 质 量 的 性 能 。 无 论 系统 能 多 快 地 解决 问题 ， 如 果 结 果 和 错误， 用 户 是 不 会 满意 的 。 男 一 方 
面 ， 解 决 速度 也 很 重要 。 最 精确 的 决 宋 或 诊断 如 果 来 的 太 慢 ， 也许 也 会 无 用 ,例如 在 病人 死亡 或 
核反应 堆 保 炸 等 紧急 情况 时 。 专 家 使 用 经 验 法 则 或 启发 式 方法 ， 通 过 目 己 的 经 验 和 对 问题 的 理 
解 来 寻找 问题 的 解决 捷径 。 专 家 系统 也 应 该 像 人 类 专家 那样 ， 运 用 局 发 式 方法 来 引导 推理 并 降 
低 解 决 方案 的 搜索 空间 。 

拥有 解释 功能 是 专家 系统 独 具 的 特征 ， 专 家 系统 通过 这 一 功能 回顾 推理 过 程 ， 并 对 其 决 禹 
进行 解释 。 所 谓 解 释 是 跟踪 整个 解决 过 程 中 被 触发 的 规则 。 这 当然 是 一 个 侧 单 的 说 法 。 事 实 上 ， 
由 于 系统 不 具备 对 该 领域 的 最 起 码 的 理解 ， 真 正 的 、 像 人 那样 的 解释 还 不 现实 。 尽 管 一 系列 被 触 
发 的 规则 并 不 能 证 明 一 个 结论 ， 我 们 仍然 可 以 为 每 一 条 规则 ， 至 少 为 知识 库 中 的 高 级 规则 ， 关 联 
上 用 文本 表达 的 恰当 的 基本 规律 。 这 也 许 是 目前 的 解释 功能 所 能 达到 的 程度 。 不 过 ， 解 释 功 能 对 
有 些 专家 系统 来 说 不 是 必需 的 。 例 如 ， 为 专家 设计 的 科学 系统 不 需要 提供 大 量 解释 ， 因 为 结论 对 
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专家 而 言 是 目 解释 的 ， 有 简单 的 规则 - 跟 踊 机 制 就 是 够 了 了。 为 一 方面 ， 用 于 决策 支持 的 专家 系统 
则 需要 完整 的 、 有 意义 的 解释 ， 和 毕竟 错误 结论 的 代价 很 高 。 

在 解决 问题 时 ， 专 家 系统 使 用 符号 推理 。 符 写 被 用 来 表示 不 同类 型 的 知识 ， 如 事实 、 概 念 和 
规则 。 构 建 专家 系统 的 目的 是 处 理 知识 ， 因 此 能 够 轻易 地 人 处理 定性 数据 ， 这 点 不 同 于 人 处理 数值 数 
据 的 传统 程序 。 

传统 程序 通过 算法 处 理 数据 ， 换 言 之 ,， 它 是 定义 好 的 逐步 的 操作 序列 。 一 个 算法 总 按 同 一 顺 
序 执行 同样 的 操作 ， 每 次 都 得 到 精确 解 。 传 统 程序 不 会 出 错 ， 只 是 程序 员 有 时 出 钳 。 专 家 系统 则 
与 传统 程序 不 同 ， 因 为 它 并 不 按照 特定 的 步骤 序列 执行 ， 允 许 不 精确 的 推理 ， 也 能 够 处 理 不 完 
整 、 不 确定 的 模糊 数据 。 

ERARS US 

再 陪 明 的 专家 也 是 人 ， 也 会 出 错 。 对 于 要 达到 人 类 专家 水 平 的 专家 系统 ， 也 应 该 容许 出 错 。 
尽管 我 们 知 息 专家 的 判断 有 时 错误 ， 但 是 我 们 仍然 信赖 专家 。 同 样 ， 尽 管 在 多 数 情 况 下 专家 系统 
所 得 的 结论 都 是 可 信赖 的 ， 有 时 依然 会 出 错 ， 我 们 要 认识 到 这 一 点 。 

这 意味 着 传统 程序 优 于 专家 系统 吗 

理论 上 ， 传 统 程序 提供 的 答案 总 是 正确 的 。 但 要 记 住 传统 程序 仅 能 处 理 数 据 完整 、 准 确 的 问 
题 。 当 数据 不 完整 或 包含 错误 时 ， 传 统 程序 要 么 无 法 应 对 ， 要 么 给 出 错误 的 答案 。 相 比 之 下 ， 专 
家 系统 能 够 识别 出 不 完整 或 者 模糊 的 信息 ， 在 这 种 情况 下 仍 能 给 出 合理 的 结论 。 

专家 系统 有 别 于 传统 程序 的 男 一 个 特征 是 ， 知 识 与 处 理 过 程 相 分 离 (知识 库 和 推理 引擎 是 
两 部 分 ) 。 而 传统 程序 中 知识 和 处 理 知 识 的 控制 结构 是 混合 在 一 起 的 ， 这 使 得 我 们 难以 理解 和 修 
改 程序 代码 ， 毕 葛 对 代码 的 修改 既 影 响 知 识 ， 又 影响 知识 的 处 理 。 在 专家 系统 中 ， 知 识 与 处 理 机 
制 被 明确 地 划分 开 ， 在 构建 和 维护 专家 系统 时 就 容易 得 多 。 如 果 使 用 专家 系统 框 染 ， 知 识 工 程 师 
或 者 专家 内需 往 知识 库 中 添加 知识 即 可 。 每 一 条 新 规则 会 市 来 新 知识 ， 专 家 系统 也 随 之 更 聪明 。 
通过 改变 、 删 减 规则 ， 能 轻易 地 修改 系统 。 

专家 系统 的 上 述 特征 使 专家 系统 有 别 于 传统 程序 和 人 类 专家 。 表 2. 1 是 三 者 之 间 的 对 比 。 


表 2.1 专家 系统 、 传 统 程序 及 人 类 专家 的 对 比 


在 狭 罕 领域 ， 以 经 验 法 则 或 启发 式 方 | 在 狭 窜 领域 ， 以 规则 形式 表达 知识 ,| 处理 数据 ， 使 用 由 一 系列 操作 组 成 
法 的 知识 形式 来 解决 问题 使 用 符号 推理 解决 问题 的 算法 ， 来 解决 一 般 的 数值 问题 
知识 与 处 理 知 识 的 控制 结构 没有 


分 离 






































在 人 脑 中 ， 知 识 以 可 编译 的 形式 存在 | ”提供 知识 与 处 理 过 程 明确 分 离 的 机 制 


在 解决 问题 过 程 中 跟踪 被 触发 的 规则 ， 


对 怎样 得 出 结论 和 需要 数据 的 原因 


能 够 解释 推理 过 程 并 提供 细节 能 够 解释 怎样 得 出 的 结论 ， 以 及 为 什么 | 部 不 做 解 各 
需要 特定 数据 的 原因 
使 用 不 精确 的 推理 ， 能 处 理 不 完整 、 人 允许 不 精确 的 推理 ， 能 处 理 不 完整 、 仅 能 在 数据 完整 、 确 定 的 情况 下 处 
不 确定 和 模糊 的 信息 不 确定 和 模糊 的 数据 理 问题 


当 数 据 不 完整 或 模糊 时 ， 要 么 无 能 
为 力 ， 要 么 出 错 
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影响 知识 和 处 理 过 程 ， 改 变 起 来 很 
mt 


当 信 息 不 完整 或 模糊 时 ， 可 能 会 出 错 | ” 当 数 据 不 完整 或 模糊 时 ， 可 能 会 出 错 






通过 多 年 的 学 习 和 实践 训练 ， 可 以 提 
高 解决 问题 的 能 力 。 不 过 这 一 过 程 缓慢 | 则 ， 可 以 提高 解决 问题 的 能 力 。 当 需要 
低 效 、 代 价 高 新 知识 时 ， 很 容 多 实现 调整 








2.6 前 向 链接 和 后 向 链接 推理 技术 
在 基于 规则 的 专家 系统 中 ,领域 知识 用 一 组 下 -THEN 产 生 式 规则 来 表示 ,数据 用 当时 情境 
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下 的 一 组 事实 来 表示 。 推 理 引 苟 将 存储 在 知识 库 中 的 规则 与 数据 库 中 的 事实 相 匹 配 ， 如 果 一 条 
规则 的 IF (条件) 部 分 与 事实 匹配 ， 即 触发 该 规则 ， 执 行 THEN (行为 ) 部 分 。 被 触发 的 规则 
可 能 由 于 添加 新 事实 而 改动 事实 集合 ， 如 图 2.4 所 示 。 数 据 库 和 知识 库 中 的 字母 表示 状态 或 
概念 。 

通过 匹配 规则 的 TF 部 分 和 事实 ， 形 成 推理 链 。 推 理 链表 明了 专家 系统 如 何 运用 规则 得 出 结 
论 。 下 面 通过 一 个 简单 的 例子 来 解释 链 式 推 理 技 术 。 

假设 数据 库 最 初 包含 5 个 事实 : A.B. C, DALE, AER MAE 3 条 规则 : 

Rule 1: IF Y is true 


AND  Distrue 
THEN Zistrue 
































Rule2: IF X is true 
AND  Bistrue 
AND  Eistrue 
THEN Yis true 


Rule 3: IF A is true 
THEN X is true 


图 2.5 中 的 推理 链表 明 了 专家 系统 运用 规则 最 终 推出 事实 2 的 过 程 。 规 则 3 最 早 被 激活 ， 由 
事实 4 推出 了 新 事实 X。 之 后 规则 2 被 激活 ， 由 初始 事实 B 和 EA， 加 上 事实 X， 共 同 推 出 事实 7。 
最 后 ， 规 则 1 被 激活 ， 由 初始 事实 D 和 刚 确 定 的 事实 了 推出 事实 Z。 











图 2.4 推理 引擎 中 的 匹配 -触发 循环 过 程 图 2.5 推理 链 的 例子 
专家 系统 能 够 用 推理 链 来 解释 怎样 得 出 的 结论 ， 这 是 解释 设备 的 必要 部 分 。 
推理 引 苟 要 决定 何 时 激活 哪 条 规则 。 选 择 规则 时 ， 有 两 个 主要 方法 : 前 向 链接 和 后 向 链接 
(Waterman and Hayes- Roth, 1978) 。 


2.6.1 前 向 链接 


上 上述 例 子 正 是 运用 了 前 向 链接 。 现 在 来 具体 地 分 析 这 一 技术 。 我 们 先 将 规则 重 写 为 如 下 
形式 : 


Rule 1: Y&D—Z 





Rule2: X&B&EY 

Rule3: AX 

箭头 表明 规则 的 正 部 分 和 THEN 部 分 。 另 外 ， 再 添加 两 条 规则 . 

Rule 4: COL 

Rule 5: L&M—N 

图 2. 6 显示 了 这 一 组 规则 按 前 回 链 接 的 运作 流程 。 

前 项 链接 是 数据 驱动 (data-driven) 的 推理 技术 。 从 已 知 数据 开始 展开 推理 。 每 一 次 只 执行 
顶端 的 一 条 规则 。 当 有 规则 被 甬 发 时 ， 束 有 新 事实 加 入 数据 库 。 任 何 规则 只 能 被 执行 一 次 。 当 没 
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有 规则 可 触发 时 ,匹配 — 触发 循环 终止 。 
数据 库 数据 库 
ra nmmn 
X 






图 2.6 前 向 链接 


第 一 轮 中 ， 只 有 两 个 规则 ， 规 则 3: 4 一 站 和 规则 4: CL， 与 数据 库 中 的 事实 匹配 。 规 
则 3: 4 一 X 处 于 顶端 ， 就 先 被 触发 。 规 则 3 的 IF 部 分 与 数据 库 中 的 事实 4 PAC, 执行 
THEN 部 分 后 ,将 新 事实 XX 加 入 数据 库 。 之 后 ,规则 4: C 一 LL 被 触发 ,新 事实 工 加 入 数 
据 库 。 

第 二 轮 中 ， 由 于 数据 库 中 己 有 事实 B、E 和 针 。 规 则 2:XX&B & 一 了 最 和 完 被 触发， 产生 事实 
7Y， 并 被 放 和 人 数据 库 。 这 导致 第 三 轮 中 规则 17& DZ 被 执行 ， 生 成 新 事实 Z。 至 此 ， 匹 配 - 激 
活 循环 终止 。 由 于 规则 5: L & MN 不 匹配 所 有 数据 库 中 的 事实 ， 规 则 5 无 法 被 触发 。 

前 问 链接 是 搜集 信息 并 推出 信息 的 技术 。 不 过 ， 在 前 问 链接 中 ， 许 多 被 触发 的 规则 也 许 与 问 
题目 标 无 关 。 在 上 面 的 例子 中 ,目标 是 推出 事实 Z。 我 们 仅 有 5 条 规则 ， 其 中 4 条 规则 被 触发 。 
规则 4: CL 虽 与 事实 Z 无 天 ， 也 同样 被 触发 了 。 一 个 真正 的 基于 规则 的 专家 系统 可 能 有 成 百 上 
千 条 规则 ， 许 多 规则 被 触发 后 虽然 能 推出 有 将 的 新 事实 ， 但 可 能 与 目标 无 关 。 所 以 ， 如 果 只 需 推 
出 一 个 特定 的 事实 ， 前 向 链接 推导 技术 或 许 效 率 很 低 。 

这 种 情况 下 ， 后 向 链接 技术 就 比较 合适 。 


2.6.2 后 向 链接 


后 问 链 接 是 目标 驱动 的 推理 技术 。 在 后 癌 链 接 中 ， 专 家 系统 有 目标 〈 一 个 假设 的 答案 ) TE 
理 引 擎 的 任务 是 找 出 证 明 目 标 的 论据 。 首 先 ， 在 知识 库 中 搜寻 含有 目标 的 规则 ， 即 THEN 部 分 包 
含 的 目标 规则 。 如 果 找 到 这 种 规则 ， 在 数据 库 中 也 有 匹配 的 事实 ， 就 触发 规则 并 证 明 目 标 。 不 过 
这 种 情况 很 少见 。 所 以 ,推理 引擎 就 暂 不 考虑 这 类 规则 (将 规则 压 栈 ) ， 要 建立 新 目标 ， 即 子 目 
标 ， 以 证 明 压 栈 规则 的 IF 部 分 。 接 下 来 ， 再 次 查找 知识 库 中 能 证 明子 目标 的 规则 。 推 理 引 擎 不 
断 将 规则 压 栈 ， 直 到 知识 库 中 的 所 有 规则 都 不 能 证 明子 目标 。 

图 2.7 以 上 述 例子 为 例 ， 显 示 了 后 回 链 接 的 工作 原理 。 

在 第 1 个 周期 ， 推 理 引 擎 尝试 推出 事实 Z。 通 过 查找 知识 库 来 寻找 THEN 部 分 包含 事实 Z 的 
规则 。 推 理 引 擎 找到 了 规则 1: Y & D 一 2， 将 它 压 栈 。 规 则 1 的 IF 部 分 包含 事实 Y 和 DD， 所 以 下 
面 是 确立 事实 了 上 和 也 。 

在 第 2 个 周期 ， 推 理 引 苟 安装 子 日 标 : 事实 了， 并 试图 确立 它 。 通 过 检查 知识 库 ， 发 现 其 中 
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没有 事实 也 因此 需要 寻找 THEN 部 分 包含 事实 7 的 规则 。 推 理 引 获 发 现 规则 2: X & B. & EY 
满足 条 件 ， 将 它 压 栈 。 规 则 2 的 IF 部 分 包括 事实 式 、 妃 和 五 ， 接 下 来 同样 需要 建立 这 些 事实 。 

在 第 3 个 周期 ， 推 理 引 擎 安 半 新 的 子 目 标 : 证 实事 实 X。 推 理 引 获 通 过 查找 数据 库 ， 发 
现 不 包含 X， 束 去 查找 能 推出 XX 的 规则 。 找 到 了 规则 3: 4 一 X， 将 它 压 栈 。 接 下 来 需要 证 实 
事实 4。 

在 第 4 个 周期 ， 推 理 引 警 发 现 4 在 数据 库 中 。 规 则 3: 4 一 汇 被 触发 ， 推 出 了 新 事实 X。 

在 第 5 个 周期 ， 推 理 引 擎 要 证 实 子 日 标 Y， 再 次 试图 执行 规则 2: X & B & EY, 由 于 事实 
X, BALE 虱 在 数据 库 中 ,规则 2 被 触发 ， 推 出 了 新 事实 了 ， 将 了 加 入 数据 库 。 

在 第 6 个 周期 ， 系 统 转 回 规 则 1: 了 & 7 一 2， 答 试 证 实 初 始 目 标 Z。 由 于 规则 1 的 TF 部 分 与 
数据 库 中 的 事实 相 匹配 ， 规 则 1 被 执行 ， 初 始 目标 得 以 证 实 。 





























第 1 个 周期 第 2 个 周期 第 3 个 周期 
数据 库 数据 库 数据 库 
Uslcloll Lelie] Lalalclole] 





目标 : Z 子 目 标 : Y 子 目标 : X 
第 4 个 周期 第 5 个 周期 第 6 个 周期 
数据 库 数据 库 数据 库 








EIE 
XY 


EIE" 





m = 
L& M—N L& M—N L& M—N 
子 目标 : X 子 目 标 : Y 目标 : Z 


图 2.7 后 向 链接 


现在 来 对 比 图 2.6 和 图 2.7。 可 以 看 出 ， 前 问 链 接 中 触发 了 4 条 规则 ， 而 后 癌 链 接 中 
只 触发 了 3 条 规则 。 这 个 简单 的 例子 说 明了 当知 要 证 实 一 个 特定 事实 时 (例子 中 是 Z)， 
后 问 链 接 更 为 有 效 。 前 癌 链 接 中 ， 在 推理 过 程 开 始 前 就 确定 了 数据 ,不 需 用 户 额 外 输入 。 
在 后 回 链 接 中 ， 确 立 目 标 后 ， 只 需要 那些 文 持 推理 的 数据 ， 有 时 也 需要 用 户 输入 一 些 数 
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据 库 中 没有 的 事实 。 

如 何 选择 前 向 链接 和 后 向 链接 

答案 是 分 析 领 域 专 家 是 如 何 解决 问题 的 。 如 末 专 家 事 和 匈 需要 搜集 信息 ， 无 论 结 论 是 什么 都 
试 春 去 推理 ， 这 时 应 选择 前 回 链 接 推 理 技术 。 如 宁 专 家 从 一 个 假设 的 结论 触发 ， 答 试 着 找 出 文 持 
结论 的 论据 ， 则 应 选择 后 回 链 接 推 理 技术 。 

前 回 链 接 对 于 设计 能 够 分 机 和 解释 的 专家 系统 来 说 ， 和 是 理所当然 的 方法 。 例 如 DEN- 
DRAL， 这 蒜 专 家 系统 基于 大 量 质 谐 效 据 来 确定 未 知 土壤 的 分 于 结构 (Feigenbaum et al. , 
1971) ， 就 使 用 了 前 回 链 接 技术 。 多 数 使 用 后 同 链 接 的 专家 系统 多 用 于 诊断 性 工作 。 例 
如 ， 诊 断 传 染 性 血液 病 的 医用 专家 系统 MYCIN (Shortliffe，1976 , ， 就 使 用 了 后 回 链 接 
TEAK o 

能 否 将 前 项 、 后 向 链接 相 结 合 

许多 专家 系统 框架 同时 使 用 了 前 项 、 后 回 链 接 推 理 技 术 ， 所 以 知识 工程 师 就 不 必 二 选 一 。 不 
过 ， 基 本 的 推理 机 制 一 般 采 用 后 回 链 接 。 只 有 当 确 立新 事实 时 ， 才 使 用 前 回 链 接 以 最 大 程度 地 利 
用 新 数据 。 























2.7 MEDIA ADVISOR: 基于 规则 的 专家 系统 实例 


接 下 来 通过 一 个 简单 的 基于 规则 的 专家 系统 进一步 说 明 上 述 概 念 。 我 们 选择 专家 系统 框 染 
Leonardo 来 构建 一 个 名 为 MEDIA ADVISOR 决策 支持 系统 ， 用 于 为 实习 生 推 荐 平台 ,该 平台 根据 
实习 生 的 工作 制订 培训 计划 。 例 如 ， 如 果实 习 生 是 一 个 负责 维护 水 压 系 统 的 机 械 技术员 ， 和 车间 就 
是 合适 的 平台 ， 在 那里 可 以 学 习 水 奈 组 件 的 工作 原理 、 如 何 检测 水 压 故 障 ， 以 及 如 何 对 水 压 系 统 
做 简单 修复 。 如 果实 习 生 是 评估 投保 单 的 员工 ， 培 训 计 划 中 就 需 包 括 特 定 相 关 任 务 的 讲座 ， 以 及 
实习 生 评 信和 实际 申请 的 教程 。 对 于 复杂 任务 ， 实 习 生 可 能 会 出 错 ， 培 训 计 划 就 应 包括 对 实习 生 绩 
效 的 反馈 。 

知识 库 

/* MEDIA ADVISOR: a demonstration rule-based expert system 

















Rule: 1 

if the environment is papers 

or the environment is manuals 

or the environment is documents 
or the environment is textbooks 
then the stimulus situation is verbal 


Rule: 2 

if the environment is pictures 

or the environment is illustrations 
or the environment is photographs 
or the environment is diagrams 


then the stimulus situation is visual 


Rule: 3 

if the environment is machines 
or the environment is buildings 
or the environment is tools 


then the stimulus situation is ‘physical object’ 


Rule: 4 

if the environment is numbers 

or the environment is formulas 

or the environment is ‘computer programs’ 


then the stimulus situation is symbolic 
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Rule: 3 

if the job is lecturing 
or the job is advising 

or the job is counselling 


then the stimulus response is oral 


Rule: 6 

if the job is building 

or the job is repairing 

or the job is troubleshooting 


then the stimulus response is ‘hands-on’ 


Rule: 7 

if the job is writing 
or the job is typing 
or the job is drawing 


then the stimulus response is documented 


Rule: 8 

if the job is evaluating 
Or the job is reasoning 

Or the job is investigating 


then the stimulus response is analytical 


if the stimulus situation is ‘physical object’ 
and the stimulus response is 'hands-on' 

and feedback is required 

then medium is workshop 


Rule: 10 

if the stimulus situation is symbolic 
and the stimulus response is analytical 
and feedback is required 

then medium is ‘lecture ~ tutorial’ 


Rule: 11 

if the stimulus situation is visual 

and the stimulus response is documented 
and feedback is not required 

then medium is videocassette 


Rule: 12 

if the stimulus, situation is visual 
and the stimulus response is oral 
and feedback is required 

then medium is ‘lecture - tutorial’ 


Rule: 13 

if the stimulus situation is verbal 
and the stimulus response is analytical 
and feedback is required 

then medium is ‘lecture - tutorial’ 


Rule: 14 

if the stimulus_situation is verbal 
and the stimulus response is oral 
and feedback is required 

then medium is 'role-play exercises' 


/* The SEEK directive sets up the goal of the rule set 

seek medium 

对 象 

MEDIA ADVISOR 使 用 6 个 语言 对 象 . environment , stimulus. situation 、 Job. stimulus, response , 
feedback 和 medium , 各 个 对 象 都 可 以 在 各 自 值 域内 取 一 个 值 (例如 ，environment 可 取 的 值 有 
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papers, manuals, documents, textbooks, pictures, illustrations, photographs, diagrams, machines , 
buildings, tools, numbers, formulas, computer programs ) 。 对 象 和 它 的 值 构 成 事实 (例如 ， 如 果 en- 
vironment is machines 和 那么 job is repairing)。 所 有 的 事实 都 存在 数据 库 中 。 


表 2.2 MEDIA ADVISOR 语言 对 象 及 其 可 取 值 








对 RR 可 取 fü 对 象 可 取 值 
environment job 

lecturing 
papers advising 
manuals counselling 
documents building 
textbooks repairing 
pictures troubleshooting 
illustrations writing 
photographs pines 
diagrams rawing 
machines evaluating 
buildings reasoning 
tools investigating 
numbers 
formulas stimulus_response | 
computer programs a 

documented 

analytical 

stimulus_ situation vec] fell 

visual required 
physical object not required 
symbolic 








选项 

基于 规则 的 专家 系统 的 最 终 目 标 是 根据 数据 找 出 问题 的 解决 方案 。 在 MEDIA ADVISOR 中 ， 
解决 方案 是 从 4 个 选项 中 选择 一 个 平台 。 

medium is workshop 

medium is ‘lecture - tutorial’ 


medium is videocassette 
medium is ‘role-play exercises’ 


对 话 

在 如 下 的 对 话 中 ， 系 统 要 求 用 户 输入 所 需 数 据 以 解决 问题 (问题 有 环境 、 工 作 和 反馈 三 方 
E). 根据 用 户 提 供 的 答案 (如 下 面 季 头 所 示 )， 专 家 系统 应 用 规则 来 推出 stimulus_situation is 
physical object, VAX the stimulus. response is hands-on 等 绪论， 再 根据 规则 9 选择 平台 。 


What sort of environment is a trainee dealing with on the job? 
= machines 

















Rule: 3 

if the environment is machines 
or the environment is buildings 
or the environment is tools 


then the stimulus situation is ‘physical object’ 


In what way is a trainee expected to act or respond on the job? 
— repairing 


Rule: 6 

if the job is building 

Or the job is repairing 

or the job is troubleshooting 


then the stimulus response is ‘hands-on’ 
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Is feedback on the trainee’s progress required during training? 
=> required 


Rule: 9 

if the stimulus_situation is ‘physical object’ 
and the stimulus response is ‘hands-on’ 

and feedback is required 

then medium is workshop 


推理 技术 





Leonardo 系统 中 标准 的 推理 技术 是 后 问 链 接 技 术 ， 偶尔 使 用 前 问 链 接 ， 它 在 处 理 可 获取 的 信 
Aya A, Leonardo 用 户 也 能 关 掉 后 问 链 接 或 前 问 链 接 ， 这 样 便 能 分 别人 研究 这 两 种 技术 。 





前 问 链 接 是 数据 驱动 的 推理 技术 ， 尖 要 预 完 提供 数据 。 假 设 : 
the environment is machines 
‘environment’ instantiated by user input to ‘machines’ 


the job is repairing 
‘job’ instantiated by user input to ‘repairing’ 


feedback is required 
‘feedback’ instantiated by user input to ‘required’ 


将 会 发 生 下 述 过 程 : 
Rule: 3 fires 'stimulus situation' instantiated by Rule: 3 to ‘physical object’ 
Rule: 6 fires 'stimulus response' instantiated by Rule: 6 to ‘hands-on’ 


Rule: 9 fires ‘medium’ instantiated by Rule: 9 to ‘workshop’ 
No rules fire stop 


后 向 链接 是 目标 驱动 的 推理 技术 ， 需 要 预先 假定 结果 (目标 ) 。 假 设 目标 是 “ 


‘workshop’ ”， 确 立 以 下 目标 : 


Pass 1 
Trying Rule: 9 
Rule: 9 stacked 


Pass 2 
Trying Rule: 3 
Rule: 3 stacked 


ask environment 


— machines 


Trying Rule: 3 


Pass 3 
Trying Rule: 9 
Rule: 9 stacked 


Pass 4 

Trying Rule: 6 
Rule: 6 stacked 
ask job 

— repairing 


Trying Rule: 6 


Pass 5 
Trying Rule: 9 
Rule: 9 stacked 


ask feedback 
— required 


Need to find object 'stimulus situation' 
Object 'stimulus situation' sought as 'physical 
object 


Need to find object ‘environment’ 
Object ‘environment’ sought as ‘machines’ 


‘environment’ instantiated by user input to 
‘machines’ 


‘stimulus_situation’ instantiated by Rule: 3 to 
‘physical object’ 


Need to find object ‘stimulus_response’ 
Object ‘stimulus_response’ sought as ‘hands-on’ 


Need to find object ‘job’ 
Object ‘job’ sought as ‘building’ 


‘job’ instantiated by user input to ‘repairing’ 
‘stimulus_response’ instantiated by Rule: 6 to 


‘hands-on’ 


Need to find object ‘feedback’ 
Object ‘feedback’ sought as ‘required’ 


‘feedback’ instantiated by user input to ‘required’ 
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Trying Rule: 9 ‘medium’ instantiated by Rule: 9 to ‘workshop’ 


medium is workshop 
用 树 形 图 来 映射 与 专家 系统 的 咨询 会 话 很 直观 。 图 2.8 是 MEDIA ADVISOR 的 树 形 图 。 目 标 
是 根 结 点 ， 当 系统 启动 时 ， 推 理 引 擎 搜寻 目标 的 值 。 





规则 :9 | [规则 :10| [38080]: | [规则 :12| [规则 ;13| | Ws 14 


激发 状态 ? BRIDLE ? <C 
规则 :1 | | 规则 :2 | | 规则 :3 | | 规则 :4| | 规则 :5 | | 规则 :6| | 规则 :7 | | 规则 :8 


询问 : 询问 : 询问 : 
environment job 反馈 


图 2.8 MEDIA ADVISOR 的 树 形 图 


MEDIA ADVISOR 能 处 理 任 何 情况 吗 
当 我 们 使 用 专家 系统 一 段 时 间 后 ， 会 发 现 可 选项 不 能 涵盖 所 有 情况 。 人 例如， 可 能 出 现下 面 的 
对 话 。 


What sort of environment is a trainee dealing with on the job? 
= illustrations 


In what way is a trainee expected to act or respond on the job? 
— drawing 


Is feedback on the trainee's progress required during training? 
— required 


I am unable to draw any conclusions on the basis of the data. 
PLA, MEDIA ADVISOR ARMEA Beh EE E HET, eis Hum, G8 ni E 630 BE 
轻易 地 扩展 专家 系统 ， 直 到 最 终 符合 用 户 的 需求 。 


2.8 冲突 消解 
在 本 章 的 开始 ,我们 举 过 过 马路 的 例子 ， 那 是 两 条 规则 ， 现 在 我 们 增加 第 三 条 规则 ， 便 得 到 








了 下 面 的 规则 集 : 
Rule 1: 
IF the ‘traffic light’ is green 
THEN the action is go 
Rule 2 
IF the ‘traffic light’ is red 
THEN the action is stop 
Rule 3 
IF the ‘traffic light’ is red 


THEN the action is go 
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将 会 发 生 什 么 

推理 引擎 将 规则 的 IF (条件) 部 分 与 数据 库 中 的 数据 相 比 较 ， 当 条 件 满足 时 触发 规则 。 由 
于 一 条 规则 被 触发 可 能 影响 到 其 他 规则 ， 推 理 引 擎 每 次 只 允许 触发 一 条 规则 。 过 马路 的 例子 有 
两 条 规则 ， 规 则 2 和 规则 3， 它 们 的 正 部 分 相同 。 当 它们 的 条 件 被 满足 时 ， 两 条 规则 都 符合 触发 
的 条 件 ， 从 而 组 成 冲突 集 。 当 多 个 规则 在 一 个 周期 内 都 满足 触发 条 件 时 ， 需 要 从 中 选择 一 条 规 
则 ， 这 个 方法 称 为 冲突 消解 (conflict resolution) 。 

当 交 通 灯 变 红 时 ， 该 执行 哪 条 规则 

如 末 用 前 回 链 接 ， 那 么 两 条 规则 都 会 被 触发 。 规 则 2 由 于 顺序 上 的 优先 ， 先 被 触发 ， 执 行 
THEN 部 分 ， 语 言 对 象 “action” 的 值 是 “stop”。“ 交 通 灯 变 红 ”这 一 事实 仍 在 数据 库 中 ， 规 则 3 
由 于 满足 条 件 也 被 触发 ， 相 应 的 对 象 “action” 的 新 什 是 “go”。 通 过 这 个 人 简单 的 例子 ,可 以 看 
出 当 使 用 前 癌 链接 时 ， 规 则 的 顺序 很 关键 。 

怎样 消解 冲突 

消解 冲突 的 显而易见 的 贫 上 略 是 确立 目标 ， 当 目标 实现 后 不 再 触发 规则 。 在 过 马路 的 例子 中 ， 
日 标 是 为 语言 对 象 “action” 确 立 值 。 当 专家 系统 为 “action” 赋 值 后 ,日 标 实现 ， 系 统 终止 。 
因此 ， 当 交通 灯 变 红 时 ， 触 发 规则 2,， “action” 的 值 是 “stop”， 至 此 系统 终止 。 在 这 个 例子 中 ， 
专家 系统 的 结论 是 对 的 。 但 如 采 调 换 两 个 规则 ,结论 就 错 了 。 这 说 明知 识 库 中 的 规则 顺 友 仍然 至 
KEH, 

存在 其 他 消解 办 法 吗 

还 有 其 他 办 法 (Shirai and Tsuji, 1985; Brachman and Levesque, 2004; Giarratano and Riley, 
2004) , 

e 触发 优先 权 最 高 的 规则 。 在 简单 的 应 用 场景 中 ， 合 理 地 排列 知识 库 中 的 规则 就 确定 了 优先 

权 。 这 种 策略 一 般 适 于 规则 数 在 100 条 左右 的 系统 。 但 在 某 些 应 用 中 ， 必 须 按照 重要 程度 

处 理 数据 。 例 如 ， 在 一 个 医疗 咨询 中 (Durkin，1994) ， 按 照 如 下 方式 设置 优先 权 : 


Goal 1. Prescription is? Prescription 





























RULE 1 Meningitis Prescription] 

(Priority 100) 

IF Infection is Meningitis 

AND The Patient is a Child 

THEN Prescription is Number 1 

AND Drug Recommendation is Ampicillin 
AND Drug Recommendation is Gentamicin 
AND Display Meningitis Prescription1 








RULE 2 Meningitis Prescription2 

(Priority 90) 

IF Infection is Meningitis 

AND The Patient is an Adult 

THEN Prescription is Number 2 

AND Drug Recommendation is Penicillin 
AND Display Meningitis Prescription2 


e 激发 最 具体 的 规则 。 这 个 方法 也 称 为 最 长 匹配 策略 ， 其 依据 的 假设 是 具体 规则 比 一 般 规 则 
处 理 更 多 的 信息 。 例 如 : 

IF the season is autumn 

AND the sky is cloudy 


AND the forecast is rain 
THEN the advice is ‘stay home’ 


IF the season is autumn 
THEN the advice is ‘take an umbrella’ 
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如 果 “ 季 市 是 秋季 、 多 云 、 预 报 有 十 ”这 些 条 件 满足 ， 由 于 规则 1 的 前 项 比 规则 2 更 具体 ， 
规则 1 A, WADE "TR BIETER, HW 被 触发 。 

e 触发 那些 在 数据 库 中 最 近 加 入 的 数据 的 规则 。 这 个 方法 依 于 数据 库 中 每 个 事实 附带 的 时 间 

标签 。 专 家 系统 优先 触发 冲突 集中 最 新 加 入 数据 的 规则 。 例 如: 

Rule 1: 


IF the forecast is rain [08:16 PM 11/25/96] 
THEN the advice is 'take an umbrella' 


Rule 2: | 
IF the weather is wet [10:18 AM 11/26/96] 
THEN the advice is 'stay home' 


假定 这 两 条 规则 的 IF 部 分 都 与 数据 库 中 的 事实 匹配 。 由 于 “weather is wet” 3X — 58 3E EA 
数据 库 的 时 间 晚 于 “forecast is rain”， 规 则 2 被 触发 。 这 个 方法 尤为 适 于 数据 库 不 断 更 新 的 实时 
应 用 环境 。 

以 上 的 冲突 消解 方法 比较 人 简单， 也 易于 实施 。 多 数 情 况 下 ， 这些 方法 足够 用 了 。 但 当 程 序 越 
来 越 庞 大 、 复 杂 时 ， 知 识 工 程 师 管 理 和 检查 知识 库 中 的 规则 的 任务 就 会 逐渐 困难 。 必 须 由 专家 系 
统 分 担任 务 ， 并 理解 系统 本 身 的 行为 。 

为 了 提高 系统 性 能 ， 我 们 需要 为 系统 提供 关于 其 所 拥有 的 知识 的 知识 ， 也 就 是 元 知识 
( metaknowledge) 。 

元 知识 可 以 简单 地 定义 为 关于 知识 的 知识 ,是 在 专家 系统 中 使 用 和 控制 领域 知识 的 知识 
(Waterman ，1986 ) 。 在 基于 规则 的 专家 系统 中 ， 用 元 规则 (metarule) 来 表示 元 知识 。 元 规则 决 
定 专家 系统 中 具体 任务 的 规则 使 用 策略 。 

元 知识 的 起 源 是 什么 

知识 工程 师 将 领域 专家 的 知识 传达 到 专家 系统 ， 学 习 如 何 使 用 问题 相关 的 规则 ， 逐 渐 在 头 
脑 里 形成 新 知识 体 ， 即 关于 专家 系统 行为 的 知识 。 这 个 新 知识 ， 即 元 知识 ， 很 大 程度 上 独立 于 领 
5X. UH. 


Metarule 1: 
Rules supplied by experts have higher priorities than rules supplied by 
novices. 





















































Metarule 2: 
Rules governing the rescue of human lives have higher priorities than rules 
concerned with clearing overloads on power system equipment. 


专家 系统 会 理解 和 使 用 元 规则 吗 

一 些 专 家 系统 为 元 规则 提供 了 单独 的 引擎 。 但 大 多 数 专 家 系统 都 不 能 区 分 规则 和 元 规则 。 
所 以 必须 对 现 有 知识 库 中 的 元 规则 设 定 最 高 权限 。 当 一 条 元 规则 触发 时 ， 能 改变 其 他 规则 优先 
权 的 一 些 重 要 信息 会 被 添加 到 数据 库 。 


2.9 基于 规则 的 专家 系统 的 优点 和 缺点 

当 构 建 基于 知识 的 系统 时 ， 基 于 规则 的 专家 系统 被 公认 为 最 好 的 选择 。 

什么 特征 使 得 基于 规则 的 专家 系统 被 知识 工程 师 青睐 

这 些 特征 是 : 

e 自然 语言 表达 。 专 家 通常 会 使 用 这 样 的 表达 来 解释 解决 问题 的 过 程 : “在 什么 一 什么 
情况 下 ， 我 如 何 一 如 何 做 。” 这 样 的 表达 可 以 被 很 自然 地 表达 为 IF-THEN 产生 式 
规则 。 

e 统一 结构 。 产 生 式 规 则 具有 统一 的 下 -THEN 结构 。 每 一 条 规则 都 是 一 个 独立 的 知识 。 产 生 
式 规则 的 语法 使 得 规则 具有 自 释 性 。 
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e 知识 与 处 理 的 相 分 离 。 基 于 规则 的 专家 系统 的 结构 为 知识 库 和 推理 引擎 提供 了 有 效 的 分 离 
机 制 。 因 此 ， 能 够 使 用 同一 个 专家 系统 框 涤 开发 不 同 的 应 用 ， 系 统 本 里 也 容易 扩展 。 在 不 
干扰 控制 结构 的 同时 通过 添加 一 些 规则 ， 还 能 使 系统 更 聪明 ， 

e 处 理 不 完整 、 不 确定 的 知识 。 大 多 数 基 于 规则 的 专家 系统 都 能 表达 和 推理 不 完整 、 不 确定 
的 知识 。 例 如 : 


IF season is autumn 

AND  skyis ‘cloudy’ 

AND wind is low 

THEN forecast is clear {cf 0.1]; 
forecast is drizzle {cf 1.0}; 
forecast is rain {cf 0.9} 


这 条 规则 就 表达 了 下 面 这 条 句子 的 不 确定 性 。 

“如 采 是 秋季 ， 看 似 在 下 毛毛 雨 ， 那 么 今天 可 能 又 很 潮湿 。 

这 条 规则 用 数值 表达 不 确定 性 ， 称 为 确信 因子 | cf 0.1|。 专 家 系统 使 用 确信 因子 来 确立 规 

则 结论 的 可 信 度 或 者 可 信 水 平 。 我 们 将 在 第 3 章 具 体 讨论 这 一 话题 。 

这 些 特征 使 得 专家 系统 在 现实 问题 的 知识 表达 上 非常 适用 。 

基于 规则 的 专家 系统 就 完美 无 缺 了 吗 

e 规则 之 间 的 关系 不 透明 。 尽 管 单 条 规则 都 比较 简单 ， 也 是 目 释 性 的 ， 大 量规 则 间 的 逻辑 天 
系 却 可 能 不 透明 。 在 基于 规则 的 系统 中 ， 难 以 观察 单条 规则 如 何 对 整个 策略 起 作用 ， 原 因 
在 于 基于 规则 的 专家 系统 缺乏 分 层 的 知识 表达 。 

e 低 效 的 搜索 策略 。 推 理 引 擎 在 每 个 周期 中 搜索 所 有 的 规则 。 当 规则 很 多 时 (多 于 100 
条 规则 ) ， 系 统 速度 会 很 慢 。 基 于 规则 的 大 型 系统 可 能 就 不 适用 于 实时 应 用 。 

e 没有 学 习 能 力 。 一 般 的 基于 规则 的 专家 系统 都 不 具备 从 经 验 中 学 习 的 能 力 。 人 类 专家 知 着 
何 时 打破 规则 ， 而 专家 系统 并 不 能 目 动 修改 知识 库 ， 例 如 调整 规则 、 添 加 规则 。 修 改 和 维 
护 系统 的 任务 仍然 由 知识 工程 师 来 做 。 









































2.10 ”小 结 


本 章 介 绍 了 基于 规则 的 专家 系统 ， 简 要 讨论 了 何 为 知识 ， 专 家 如 何以 产生 式 规则 形式 
表达 知识 。 我 们 分 析 了 专家 系统 开发 团队 的 主要 成 员 ， 描 述 了 基于 规则 的 系统 的 结构 ， 分 
析 了 专家 系统 的 主要 特征 ， 并 指出 专家 系统 也 有 出 错 的 时 候 。 接 下 来 回顾 了 前 回 链 接 、 后 
癌 链 接 推 理 技术 ， 对 冲突 消解 末 略 进行 了 讨论 。 最 后 ， 我 们 分 析 了 基于 规则 的 专家 系统 的 
优 缺 点 。 

本 章 的 主要 内 容 为 : 

e 知识 是 对 主题 的 理论 和 实践 两 方面 的 理解 ， 是 当前 所 知 的 总 和 。 

e 专家 是 在 特定 领域 具有 深厚 知识 (以 事实 和 规则 的 形式 体现 ) 和 丰富 经 验 的 人 人， 能够 做 

他 人 做 不 到 的 事情 。 

e 专家 通 第 以 产生 式 规 则 形式 表达 知识 。 

ej EORUM IF (前 提 ) THEN (绪论 ) 语句 表达 ， 它 是 最 常用 的 知识 表达 方式 。 关 系 、 

建议 、 指 示 、 策 略 以 及 局 发 式 方法 都 可 以 用 规则 表达 。 

e 专家 系统 是 在 狭 罕 问 题 领 域 具 有 专家 水 平 的 计算 机 程序 。 基 于 规则 的 专家 系统 是 最 普及 的 

CRAB. 
e Jr A AE T MUMS RA SUN, HEART DON T8 FTE, ERRER ERA MR EK 
RRAR, SPAMMERS, HA ASU SSAA, JETEBUHOS US. A 
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此 ， 专 家 系统 框架 大 大 降低 了 系统 的 开发 时 间 。 

e 专家 系统 团队 由 领域 专家 、 知 识 工程 师 、 程 序 员 、 项 目 经 理 以 及 终端 用 户 组 成 。 知 识 工程 
师 设 计 、 构 建 和 测试 专家 系统 ， 并 从 领域 专家 那里 获取 知识 ， 确 定 推理 方法 ， 以 及 选择 开 
发 软件 。 当 使 用 专家 系统 框架 开发 小 型 系统 时 ,项 上 日 经 理 、 知 识 工程 师 、 程 序 员 其 至 领域 
专家 都 可 能 是 同一 个 人 。 

e 基于 规则 的 专家 系统 包括 S 个 基本 组 成 部 分 : 知识 库 、 数 据 库 、 推 理 引 和 擎 、 解 释 设 备 以 及 
用 户 界面 。 知 识 库 包含 用 一 系列 规则 表示 的 知识 。 数 据 库 包 含 一 系列 事实 ， 用 于 和 规则 的 
IF 部 分 相 匹配 。 推 理 引 擎 链接 规则 和 事实 ， 执 行 推 理 ， 以 使 系统 得 出 解决 方案 。 解 释 设 
备 帮 助 用 户 查 询 系统 如 何 得 出 一 个 结论 ， 以 及 为 什么 需要 某 一 个 事实 。 用 户 界 面 则 是 用 户 
和 专家 系统 的 互动 途径 。 

e 专家 系统 将 知识 库 和 推理 引擎 分 隔 开 ， 以 分 离 知 识 和 对 知识 的 处 理 ， 从 而 使 专家 系统 的 构 
建 和 维护 更 加 容易 。 当 使 用 专家 系统 框架 时 ， 知 识 工程 师 或 者 专家 只 需 将 知识 录入 知识 
库 。 每 请 加 一 条 新 规则 ， 郡 会 扩充 知识 ， 也 使 专家 系统 更 聪明 。 

e 专家 系统 在 问题 -解决 会 话 中 跟踪 被 触发 的 规则 ， 从 而 具备 一 定 的 解释 能 

e 专家 系统 能 够 处 理 不 完整 、 不 确定 的 数据 ， 也 允许 不 精确 的 推理 ， 这 不 同 于 传统 
程序 。 不 过 正如 人 类 专家 那样 ， 当 信息 不 完整 或 模糊 时 ， 专家 系统 也 有 出 错 的 
时 候 。 

e 进行 搜索 和 推理 有 两 个 主要 方法 : 前 回 链 接 和 后 回 链接 推理 技术 。 前 辐 链 接 是 数据 驱动 
的 : 从 已 知 数据 出 发 进行 推理 ， 和 直到 没有 规则 可 以 被 激活 。 后 回 链 接 是 目标 驱动 的 : BUC 
设 定 目标 ， 推 理 引擎 负责 寻找 证 明 目 标 的 论据 。 

© 如 采 在 一 个 循环 内 有 多 条 规则 满足 触发 条 件 ， 推 理 引 擎 必须 决定 该 触发 哪 条 规则 ， 这 种 行 
为 称 为 冲突 消解 。 

e 基于 规则 的 专家 系统 的 优点 是 : 能 够 有 目 然 的 知识 表达 方式 ， 有 统一 的 结构 ， 知 识 和 对 知 
识 的 处 理 相 分 离 ， 能 处 理 不 完整 、 不 确定 的 知识 。 

e 基于 规则 的 专家 系统 的 缺点 是 : 规则 之 间 的 关系 不 透明 ,， 搜索 策略 低 效 ,不 具备 学 习 
能 力 。 
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知识 是 什么 ? MENTA T jas MRA RERNA REKA EER, TP ZUR ANI? 
产生 式 规则 是 什么 ? 举例 说 明 产 生 式 规则 的 两 个 必要 部 分 。 

列举 并 描述 专家 系统 开发 团队 的 5 个 主要 成 员 。 知 识 工程 师 的 任务 是 什么 ? 

TAREE RA MER? 解释 为 什么 专家 系统 框 染 会 大 大 降低 系统 的 开发 时 间 。 

什么 是 产生 式 系 统 模型 ? 列举 并 摘 述 专家 系统 的 5 个 基本 组 成 部 分 。 

专家 系统 的 主要 特征 是 什么 ? 专家 系统 与 传统 程序 的 区 别 在 哪里 ? 

专家 系统 会 出 错 吗 ? 为 什么 ? 

描述 前 向 链接 推理 技术 并 举例 。 

描述 后 向 链接 推理 技术 并 举例 。 




















10 列举 前 回 链 接 推 理 技术 适合 解决 的 问题 。 为 什么 后 加 链接 适合 解决 诊断 问题 ? 


11 


什么 是 规则 冲突 集 ? 怎么 解决 冲突 ? 列举 并 描述 基本 的 冲突 消解 方法 。 


12. ”列举 基于 规则 的 专家 系统 的 优 缺 点。 


ww ai bbt. com [] E] EL ET B] E]. E] 





34-325 基于 规则 的 专家 系统 


参考 文献 


Brachman, R.J. and Levesque, H.J. (2004). Knowledge Representation and Reasoning. 
Elsevier, San Francisco. 

Duda, R., Gaschnig, J. and Hart, P. (1979). Model design in the PROSPECTOR consultant 
system for mineral exploration, Expert Systems in the Microelectronic Age, D. Michie, 
ed., Edinburgh University Press, Edinburgh, Scotland, pp. 153-167. 

Durkin, J. (1994). Expert Systems: Design and Development. Prentice Hall, Englewood 
Cliffs, NJ. 

Feigenbaum, E.A., Buchanan, B.G. and Lederberg, J. (1971). On generality and problem 
solving: a case study using the DENDRAL program, Machine Intelligence 6, B. Meltzer 
and D. Michie, eds, Edinburgh University Press, Edinburgh, Scotland, pp. 165-190. 

Giarratano, J. and Riley, G. (2004). Expert Systems: Principles and Programming, 4th edn. 
Thomson/PWS Publishing Company, Boston, MA. 

Negnevitsky, M. (2008). Computational intelligence approach to crisis management in power 
systems, International Journal of Automation and Control, 2(2/3), 247—273. 

Newell, A. and Simon, H.A. (1972). Human Problem Solving. Prentice Hall, Englewood 
Cliffs, NJ. 

Shirai, Y. and Tsuji, J. (1985). Artificial Intelligence: Concepts, Technologies and Applica- 
tions. John Wiley, New York. 

Shortliffe, E.H. (1976). MYCIN: Computer-Based Medical Consultations. Elsevier Press, 
New York. 

Waterman, D.A. (1986). A Guide to Expert Systems. Addison-Wesley, Reading, MA. 

Waterman, D.A. and Hayes-Roth, F. (1978). An overview of pattern-directed inference 
systems, Pattern-Directed Inference Systems, D.A. Waterman and F. Hayes-Roth, eds, 
Academic Press, New York. 


ww ai bbt. com [] E] EL ET D] ET E] 





| 第 3 ni 


Artificial Intelligence, 3E 


JE TL MU fg E Be FR Se PY AB oe TE T PR 





本 章 主 要 介绍 不 确定 性 管理 范例 、 贝 叶 斯 推理 和 确信 因子 ， 讨 论 它 们 的 优 缺点 ， 并 以 实例 阐 


3.1 不 确定 性 简介 


不 完美 是 可 供 人 类 专家 使 用 的 信息 的 共同 特点 之 一 。 信 息 可 能 是 不 完整 的 、 不 一 致 的 、 不 确 
定 的 ， 也 许 会 同时 有 这 3 个 方面 。 也 就 是 说 ， 这 样 的 信息 总 是 不 适合 于 解决 问题 。 然 而 ， 专 家 却 
能 应 对 这 些 缺 隐 ， 并 通 币 做 出 正确 的 判断 和 决定 。 相 应 地 ， 专 家 系统 也 应 能 够 处 理 不 确定 因素 ， 
并 给 出 有 效 的 结论 。 

在 专家 系统 中 ， 不 确定 性 指 什么 

不 确定 性 是 指 ， 不 具有 使 我 们 得 出 完美 可 信和 绪论 所 需 的 准确 的 知识 (Stephanou and Sage, 
1987) 。 传 统 逻 辑 只 人 允许 精确 推理 ， 总 假设 存在 完善 知识 ， 并 总 能 使 用 排 中 律 


IF A is true 
THEN A is not false 


和 


IF B is false 
THEN JB is not true 


然而 ， 用 专家 系统 来 解决 的 大 多 数 实 际 问题 并 不 能 提供 精确 的 知识 ， 而 是 提供 不 精确 、 不 完 
整 甚 至 不 可 测 的 数据 。 
专家 系统 中 不 确定 性 知识 的 来 源 是 什么 
我 们 一 般 将 来 源 分 为 4 种 : 弱 上 暗示、 不 精确 的 语言 、 未 知 数据 ， 以 及 合并 不 同 专家 观点 时 的 
困难 (Bonissone and Tong，198$) 。 下 面具 体 分 析 这 4 种 来 源 。 
e 弱 上 暗示。 基于 规则 的 专家 系统 背面 临 弱 暗示 和 模糊 联系 的 问题 。 在 确立 规则 的 下 (条 
fF) TI THEN (行为 ;两 部 分 的 具体 关联 时 ， 领域 专家 和 知识 工程 师 会 感到 棘手 ， 或 者 
难以 进行 。 因 此 ， 处 理 模糊 联系 就 成 了 专家 系统 的 任务 ， 例 如 用 数值 型 确信 因子 表达 关 
FRE 
e 不 精确 的 语言 。 上 自然 语言 是 天 生 模 糊 、 不 精确 的 。 我 们 在 描述 事实 时 ， 会 用 到 “常常 、 
有 时 、 频 繁 地 、 几 乎 不 ”之 类 的 术语 。 因 此 ， 难 以 用 精确 的 IF -THEN 产生 式 规 则 表 
达 知 识 。 如 采 将 事实 含义 定量 化 ， 束 可 以 用 于 专家 系统 。1944 年 ，Ray Simpson 让 355 
个 高 中 生 或 大 学 生 对 20 个 类 似 “ 和 党 第 ”的 术语 表达 为 1 ~ 100 范围 内 的 数值 ( Simp- 
son, 1944) , Æ 1968 ^F, Milton Hakel 重 做 了 这 个 实验 (Hakel，1968 ) 。 结 果 如 表 3.1 
所 示 。 通 过 量化 术语 含义 ， 使 专家 系统 能 建立 规则 的 下 (条件 ) 和 事实 之 间 的 恰当 



































匹配 。 
e 未知 数据 。 当 数据 不 完整 或 缺失 时 ， 唯 一 的 方法 是 将 值 设 为 “未 知 "， 以 使 推理 继续 
FR, 


e 融合 不 同 专家 的 观点 。 大 型 专家 系统 通常 会 融合 多 个 专家 的 知识 和 经 验 。 例 如 ， 在 开发 
勘探 专家 系统 PROSPECTOR 时 ， 有 9 个 专家 参与 (Duda et al. , 1979), 不过， 专家 们 的 
结论 很 少 一 致 。 观 点 不 同 导 致 规则 冲突 。 为 了 解决 冲突， 知识 工程 师 需要 为 每 位 专家 分 





ww ai bbt. com [] E] EL ET B] E]. E] 





36 : 第 3 章 基于 规则 的 专家 系统 中 的 不 确定 性 管理 


配 一 个 权重 ， 并 按 权重 综合 各 方 结 论 。 事 实 上 ， 即 使 只 有 一 个 领域 专家 ,他 的 经 验 水 平 
也 在 变化 。 男 外 ， 不 存在 确定 权重 的 系统 性 方法 。 
总 之 ， 由 于 任何 实际 领域 都 包含 不 确定 知识 ， 专 家 系统 应 能 够 管理 不 确定 性 ， 能 够 处 理 不 完 
整 、 不 一 致 甚至 缺失 的 数据 。 在 基于 规则 的 专家 系统 中 ， 已 有 许多 数值 型 和 非 数 值 型 方法 来 处 理 
不 确定 性 (Bhatnagar and Kanal, 1986) 。 本 和 草 将 讨论 最 通用 的 不 确定 性 管理 范例 : 贝 叶 斯 推理 和 
确信 因子 。 下 面 首先 回顾 一 下 经 典 概率 论 的 基本 原理 。 


表 3.1 模糊 术语 、 不 精确 术语 在 时 间 频 率 范 围 上 的 量化 

















Ray Simpson (1944) Milton Hakel (1968) 

术语 均值 术语 均值 
Always 99 Always 100 
Very often 88 Very often 87 
Usually 85 Usually 79 
Often 78 Often 74 
Generally 78 Rather often 74 
Frequently 73 Frequently 72 
Rather often 65 Generally 72 
About as often as not 50 About as often as not 50 
Now and then 20 Now and then 34 
Sometimes 20 Sometimes 29 
Occasionally 20 Occasionally 28 
Once in a while 15 Once in a while 22 
Not often 13 Not often 16 
Usually not 10 Usually not 16 
Seldom 10 Seldom 9 
Hardly ever f Hardly ever 8 
Very seldom 6 Very seldom 7 
Rarely 5 Rarely D 
Almost never 3 Almost never 2 
Never 0 Never 0 


3.2 概率 论 基 本 知识 


概 座 这 一 基本 概念 在 我 们 的 日 党 生活 中 扮演 着 重要 角色 ,例如 要 下 雨 的 概 京 ,得 到 提 
升 的 可 能 性 ， 澳 大 利 亚 板 球 队 在 下 一 个 赛季 获胜 的 几率 ， 中 了 Tattslotto 彩票 百 万 美元 的 概 
AE 

概率 的 概念 有 看 很 长 的 历史 ， 可 回溯 到 上 千年 之 前 ， 那 时 口语 中 已 经 出 现 了 诸如 “proba- 
bly”, “likely” | “maybe”, “perhaps” , “possibly” Z% ÁJ] (Good，1959)。 不 过 ,概率 的 数学 
理论 是 17 世纪 才 形 成 的 。 

如 何 定 义 概率 

事件 的 概率 是 该 事件 发 生 所 占 的 比例 (Good, 1959) 。 概 率 也 可 以 定义 为 可 能 性 的 科学 度 
Œo Feller (1966; 1968) 和 Fine (1973) 写 的 两 本 著名 教材 中 对 现代 概率 理论 进行 了 详细 分 析 。 
本 章 仅 研 究 在 专家 系统 中 与 不 确定 性 相关 的 基本 概率 概念 。 

概率 可 表示 为 0 (不 可 能 发 生 ) 到 1 (必然 发 生 ) 范围 内 的 数值 型 指标 。 大 部 分 事件 的 概率 
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HPD ARS AG IRAE O0 ~ 1 之 间 ， 这 意味 着 每 一 个 事件 至 少 有 两 个 绪 末 : 有 利 的 结 琳 或 成 功 ， 不利 
的 结 末 或 失败 。 
成 功 、 失 败 的 概率 计算 公式 可 表示 为 : 
成 功 次 数 


PU BOM) = Sareea Ag EORR em) 

失败 次 数 
PURO = xyREZE RES BR 2) 

因此 ， 如 果 用 s 表示 成 功 次 数 ，/ 表 示 失 败 次 数 ， 则 有 : 
PORD) =p =, (3.3) 
PRB) =9= T. (3.4) 

和 

ptq=l (3.5) 


ATE, df] e AY LE Aa AY I FEET, 1E EA BT EE aS A 
一 样 的 。 在 一 次 投掷 中 ,，s =f=1， 因 此 正面 (或 反面 ) 天 上 的 概率 是 0.5。 
再 以 掷 般 子 为 例 ， 分 析 单 次 投手 时 得 到 6 点 的 概率 。 假 设 我 们 的 目标 是 6 点 ， 由 于 单 次 投 撕 
时 ， 仅 有 一 种 情况 是 6 点 ， 而 有 5 种 情况 不 是 6 点 ， 所 以 s =1, f=5。 得 到 6 点 的 概率 是 
1 
Pw 145 








= 0. 1666 


结果 不 是 6 点 的 概率 是 
— 
a 2. "s 


到 现在 为 止 ,我 们 所 观 注 的 事件 都 是 独立 ESE 89 CR TEARS D B8 RIETI HE) V ERT BJ BE 
中 ,得 到 6 点 与 得 到 1 点 这 两 个 事件 就 是 互 斥 的 ,因为 不 可 能 在 一 次 投手 中 同时 得 到 6 点 和 1 点 。 
同时 ,如 果 事 件 不 独立 ,可 能 影响 其 他 事件 发 生 的 可 能 。 如 果 在 毛 般 子 时 ,知道 1 点 不 会 出 现 ,我 们 
来 分 析 单 次 投掷 中 得 到 6 点 的 概率 。 虽 然 有 5 种 情况 不 会 出 现 6 点 ,由 于 1 点 不 会 出 现 , 就 排除 了 
1 种 情况 ,所 以 ， 


= 0. 8333 














1 
PT714(5-1) 
GAB SASSI SE. BRERA ALB 两 个 不 互 斥 的 事件 ,一 个 事件 的 发 生 条 件 人 依赖 于 妃 
一 个 事件 的 发 生 。 在 事件 如 发 生 的 基础 上 事件 4 发 生 的 概率 称 为 条 件 概率 ,用 数学 形式 表示 为 p 
(ALB) ,其 中 的 紧 线 “1 表示 后 面 事件 已 发 生 。 完 整 的 概率 表达 式 可 理解 为 “在 事件 下 已 发 生 的 情 
OLR ,事件 4 发 生 的 条 件 概 率 ”。 
_A 和 B 都 发 生 的 次 数 


P(418) = BRE BU CR 
A 和 B 都 发 生 的 概率 ， 称 为 4 和 B INIRGRA, CBMBBCERIJEUEp(AQB), SE BAR 
的 次 数 ， 或 者 B 发 生 的 概率 ， 用 p(B) 表示 。 那 么 有 : 
p(ANMB) 
p(B) 
类 似 地 ， 在 事件 4 发 生 的 前 提 下 ， 事件 B 发 生 的 条 件 概率 是 








(3.6) 





p(AIB) = (3.7) 
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_p(BNA) 
p( BIA) = ES (3.8) 
因此 ， 
p( BOA) =p( BIA) xp(A) (9,9) 





由 于 联合 概率 具有 可 交换 性 ， 则 有 : 
P(ANB) =p(BNA) 


所 以 ， 
P(ANB) p( BIA) xp(A) (3. 10) 
将 公式 (3.10) 代入 公式 (3.7), WA: 
_p(BIA) xp(A) 
p(AlB) = (B) (3. 11) 
其 中 : 


p(418) 是 在 事件 B 发 生 时 ,事件 4 发 生 的 条 件 概率 ; 
p(B14) 是 在 事件 4 发 生 时 事件 B 发 生 的 条 件 概 率 ; 
p(4) 是 事件 4 发 生 的 概率 ; 
p(B) 是 事件 B 发 生 的 概率 。 
公式 (3.11) Wæ N TAALI], FE 18 世纪 英国 数学 家 Thomas Bayes 首先 提出 了 该 规则 ， 以 
他 的 名 字 命 名 的 。 
前 面 所 讲 的 条 件 概 率 的 概念 都 假定 事件 4 依赖 事件 。 贝 叶 斯 规则 可 以 扩展 为 事件 4 依赖 多 
个 互 太 事件 B ，B,，…，B, 的 情况 。 可 将 公式 (3.7) 扩展 为 以 下 情况 : 
p(AMB,) =p(A1B,) xp(B,) 
p(ANMB,) =p(AIB, ) x p(B, ) 


p(ANB,) =p(AlB,) xp(B,) 


或 合并 为 
> pans, = > p(AIB,) x p(B, ) (3. 12) 
如 果 公 式 (3. 12) 包含 了 图 3.1 中 的 所 有 事件 B,， 则 有 公式 
> p(AnB,) =p(4) (3.13) 
Bub, Ast (3.12) 变 为 下 面 形式 ; 
p(4) = > p(AlB,) xp(B) (3.14) 


如 果 事 件 4 AACE HF DS BR SE, BD B 发 生 或 PP 不 发 生 ， 
公式 (3.14) 则 变 为 下 面 形 式 ， 
p(A) =p(AIB) xp( B) +p(AlaB) xp(-7B) (3.15) 
其 中 ,一 表示 逻辑 运算 符 NOT。 


p(B) =p(BIA) xp(A) * p( BI24) xp(^A) (3. 16) m 
: CT HER 266 
将 公式 (3.16) 代入 公式 (3.11)， 得 到 下 面 的 贝 叶 斯 规则 ce ee 








> 
RE 


p(BIA) x p(A) (3.17) 


p(AlB) = CBA) x p( A) *p(Bl a4) Xp(S4) 
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公式 (3.17) 为 专家 系统 中 的 不 确定 性 管理 提供 了 概率 论 的 应 用 背景 。 


贝 叶 斯 推理 
有 了 公式 (3.17) ， 我 们 就 可 以 暂时 放下 基本 的 概率 理论 ， 将 注意 力 转移 到 专家 系统 上 。 假 





设 知识 库 中 的 所 有 规则 都 用 下 面 形式 表示 : 


IF 


E is true 


THEN His true {with probability p] 


WW A SCE MUR EE ACHE, WE ACE ARE po 





RSA EE 已 发 生 ， 但 不 知道 事件 全 是 否 也 发 生 ， 怎 样 计算 吃 发 生 的 概率 
我 们 用 公式 (3.17) 就 能 回答 这 个 问题 。 我 们 现在 使 用 符号 五 和 饭 ， 而 不 是 4 和 B。 对 于 专 


家 系统 ， 有 表示 假设 ,表示 文 持 假设 的 论据 。 我 们 用 万 和 TAX (3.17) : 


p(E\H) x pCH) 


pCEIH) xp(H) * p(EISH) xp(5H) (3.18) 





p(HIE) = 


其 中 ， 

p(H) 是 假设 万 为 真 的 先 验 概率 ; 

p(ElH) 是 假设 五 为 真 时 导致 论据 的 概率 ，; 

pOH) 是 假设 万 为 假 的 先 验 概率 ; 

p(EISH) 是 在 假设 为 假 时 发 现 证 据 E 的 概率 。 

公式 (3.18) 表明 在 假设 万 的 先 验 概率 p CH) 必须 在 检验 证 据 前 定义 。 在 专家 系统 中 ， 解 




















决 问题 时 需 用 到 的 概率 由 专家 提供 ， 专 家 定义 p(H) 和 p(-H) 这 两 个 先 验 概率 ， 以 及 条 件 概 率 
P(EIH) 和 p(E1l-H)。 用 户 提 供 论 据 E 的 有 关 信息 ， 由 专家 系统 计算 p(HIE)。p(HIE) 称 为 
Js US d e 


DP 








如 果 专 家 根据 单个 论据 E， 提 出 了 多 个 假设 有 、HH;,、…、H,;， 而 非 一 个 假设 ,或 给 定 多 个 


论据 ES 、E,。、…、E,， 专 家 也 提供 了 多 个 假设 
可 以 将 公式 (3.18) 推广 到 包含 多 个 假设 五 、H,、…、H,, 和 多 个 论据 E. E, os. E, BUR 








， 假 设 和 论据 都 必须 是 互 斥 且 完 备 的 。 


对 于 单个 论据 和 多 个 假设 五 、H,、…、H ,的 情况 ， 有 下 面 公式 : 


nae (3.19) 
之 p(E MH) x p( H,) 
对 于 多 个 论据 E, E... ESGMZEGXHS H, c. Ata OL, WE: 
p CH, | E,E,:-E,) = PUR EE mall x pU) (3. 20) 


X p(E,E,--E,|VH,) x p(H,) 
k=1 


在 应 用 公式 (3.20) 时 ,需要 论据 和 假设 所 有 可 能 组 合 的 条 件 概率 。 这 对 于 专家 来 说 是 个 








巨大 的 人 负担， 实际 上 不 可 能 完成 。 所 以 ,在 专家 系统 中 ， 可 忽略 微小 的 论据 ， 并 假设 论据 间 条 件 
独立 (Ng and Abramson，1990)。 因 此 我 们 得 到 了 下 面 的 公式 











p(E, |H;) x p( E, VTH,) x+ x p(CE, |H,) xp(H.) 


p(H, VE, E, E,) = (3. 21) 


m 


> p(E,1H,) x p(B, |H,) x + xp(E,1H,) x p(H,) 


专家 系统 怎样 计算 所 有 的 后 验 概率 ， 并 对 真 假设 按 可 能 性 排名 
考虑 一 个 简单 的 例子 。 假 设 有 3 TRIE E, E E, ERKE NEHA 
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HEI H, H, H., FIE T ARERR pH), pCH,) , pCH,) ,. 同时 对 于 每 一 个 假 
设 ， 也 确定 了 每 一 个 论据 的 条 件 概 率 。 表 3. 2 为 专家 提供 的 先 验 概率 和 条 件 概 率 。 


表 3. 2 先 验 概率 和 条 件 概率 


假设 


概率 
i=2 i =3 
pCH;) 0. 35 0. 25 
pCE,1H;) 0. 8 0.5 
pCE,MH;) 0.0 0. 7 
p(E; 1H; ) 0.7 He 








假定 我 们 首先 看 到 了 论据 天 ， 专 家 系统 按照 公式 (3.19) 计算 所 有 假设 的 后 验 概率 . 
p(H IE,) _ D | H; ) x p(H,) P2198 
> p(E, | H,) x p( H,) 


k=] 


因此 ， 
0.6 x 0. 40 
PURI E) = v NUEURSD x ox 075 Oo 
0.7 x 0.35 
PULSI E) = UC ene 025898. 90.25 = O 3 
pL LE = 0.9 x 0.25 "T 


~ 0.6 x0.40 40.7 x 0.35 40.9 x 0.25 
可 以 看 出 ， 当 观察 到 论据 5, 后 ,假设 五 的 可 信和 度 降 低 ， 和 石 ,的 可 信和 度 相 同 。 假 设 石 的 可 信 
度 增加 ， 几 乎 和 有 、, 的 可 信和 度 相 等 。 
现在 假设 又 得 到 了 论据 局 ， 用 公式 (3.21) 计算 后 验 概率 . 


pCE, | H, ) x pC E, | H, ) x p( H;) . 
—; — SS s Ls —— pu La 


2, pE, |H,) x p( E, | H,) x p( H,) 








p(H,VE,E,) = 


所 以 有 ， 
0.3 x0. 6 x 0. 40 
PAH VE ) 5 30.6 x0.40 30.8 x0.7 x0.35:10.5 x0.9x0,25 7 17 


0. 8 x0. 7 x0. 35 E 
0. 3 x0. 6 x0. 40 +0. 8 x0. 7 x0. 35 40.5 x0.9x0.25 — 


0.5x0.9x0.25 " 
0.3 x0.6 x0.40 20.8 x0.7 x0. 35 40.5 x0.9 x0. 25 . 


ZEREA RT REVERE, TH, WAT REPEZIT E. 
假设 又 观察 到 了 论据 E,， 专 家 系统 就 可 以 计算 所 有 假设 最 终 的 后 验 概率 。 


E IH) Xpop(E, IH) Xp(ELIH) xp(H. 
p(HIE EE,) = pl 1 1H,) x p(E,1H,) x pCE,1H;) xp(H,) | i2123 


> p(E, | H,) x p( E, |H,) x p( E, | H,) x p( H,) 





p(H,IE,E,) = 0. 52 


p(H,IE,E,) = 0. 29 





因此 ， 


0.3 x0.9 x0.6 x0.40 
p(H, IE E, E, ) -0 


.3 x0.9 x0. 6 x0. 40 +0. 8 x0.0 x0. 7 x0.35 40.5 x0.7 x0.9 x0. 25 
= 0. 45 
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0. 8 x0. 0 x0. 7 x0.35 
pi ~0.3 x0.9 x0. 6 x0. 40 +0. 8 x0. 0 x0. 7 x0.35 40. 5 x0. 7 x 0.9 x0. 25 


-0 
DUAE) ‘jose 0000000 EATE 
=0. 55 

尽管 专家 按 可 能 性 对 3 个 假设 的 最 初 排名 是 H，、 有 H, ERRE 3 个 论据 (E, EE, ) 
E, RZE H A, ， 可 以 放弃 8,。 通 过 计算 我 们 认为 A, 的 可 能 性 要 大 于 HH 。 

用 于 勘探 的 专家 系统 PROSPECTOR 是 第 一 个 使 用 贝 叶 斯 规则 计算 p(HIE) 并 在 系统 中 传送 
不 确定 性 的 专家 系统 (Duda et al. ，1979)。 下 面 用 一 个 简单 的 例子 来 解释 专家 系统 中 的 贝 叶 斯 
推理 。 


3.4 FORECAST: 论据 累积 的 贝 叶 斯 万 法 


现在 我 们 开发 一 个 解决 实际 问题 (如 天 气 预 报 ) 的 专家 系统 。 系 统 功能 是 预测 明天 是 否 下 
雨 ， 它 需要 一 些 实际 数据 ， 这 可 以 从 气象 局 得 到 。 

表 3.3 总 结 了 伦敦 在 1982 年 3 月 的 气象 数据 ， 包 括 每 天 的 最 低 、 最 高 温度 ， 降 雨量 和 日 昭 
时 间 。 如 果 一 天 的 降雨 量 为 零 ， 则 说 明 一 天 不 下 雨 。 

专家 系统 所 能 提供 的 结果 有 两 个 tomorrow is rain (HA F), tomorrow is dry (明天 不 下 
雨 )， 以 及 这 两 个 结果 的 可 能 性 。 也 就 是 说 ， 专 家 系统 必须 给 出 “明天 下 雨 "、“ 明 天 不 下 十 ”这 
两 个 假设 的 条 件 概 率 。 

在 应 用 贝 叶 斯 规则 (公式 (3.18)) Bü, 我们 必须 提供 这 两 个 假设 的 先 验 概率 。 

首先 根据 提供 的 数据 写 下 两 条 基本 规则 ， 用 它们 预报 明天 的 天 气 。 

Rule: 1 


IF today is rain 
THEN tomorrow is rain 























Rule: 2 
IF today is dry 
THEN tomorrow is dry 


有 了 这 两 条 规则 ， 我 们 项 多 犯 10 次 错误 ， 每 次 上 晴天 后 是 十 天， 雨天 后 是 上 晴天。 所 以 两 个 假 
设 的 先 验 概率 都 是 0.5。 接 下 来 以 下 面 形 式 重 写 规 则 - 
Rule: 1 


IF today is rain {LS 2.5 LN .6} 
THEN tomorrow is rain {prior .5} 














Rule: 2 
IF today is dry {LS 1.6 LN .4} 
THEN tomorrow is dry {prior .5} 


33.3 1982 年 3 月 伦敦 天 气 总 结 


日 ”| 最 低温 度 CC) | 最 高 温度 CC) 实际 天 气 预报 天 气 
1 9.4 11.0 17.5 3.2 下 雨 — 

2 4.2 12. 5 4.1 6.2 下 雨 F 
3 7.6 11.2 13 1.1 TS TS 
4 5.7 10. 5 0.0 4.3 青天 TRO 
5 3.0 12.0 0.0 9. 5 青天 青天 
6 4.4 9. 6 0.0 3.5 青天 青天 
7 4.8 9.4 4. 6 10. 1 E: 下 雨 
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(5) 
| 最 低温 度 (C) | 最 高 温度 (CC) 实际 天 气 预报 天 气 
8 .8 9.2 5.5 7.8 下 雨 下 十 
9 .4 4.8 4.1 FR F 
10 .5 4.2 3.8 Fi F 
11 .7 4.4 9.2 E: 下 雨 
12 .9 4.8 7:3 Fi 下 雨 
13 .0 0.0 8.3 青天 FO 
14 4 4.8 1.8 TH GRY 
15 .8 8.8 0.0 F 下 雨 
16 .4 3.0 3.1 下 十 下 十 
17 .3 0.0 4.3 青天 青天 
18 .4 4.2 6. 6 PRR PRR 
19 .4 5.4 0.7 下 十 下 十 
20 .1 3.0 0.1 TS TS 
21 .4 0.0 0.0 ËR 青天 
22 .6 0.0 6.8 青天 青天 
23 2 0.0 8.8 青天 青天 
24 .9 0.0 9.5 青天 青天 
25 .8 0.0 0.3 青天 青天 
26 .9 0.0 .9 青天 青天 
27 .8 0.0 .3 青天 青天 
28 .8 aD .0 下 雨 BRO 
29 .7 0.0 p 青天 青天 
30 .5 4.8 .8 下 十 下 雨 
31 .6 B. P o) TS TS 








CD 表示 预报 错误 。 


LS 的 值 是 在 论据 E 存 在 时 ， 专 家 估计 假设 的 可 能 性 ， 称 为 充分 性 似 然 值 ， 定 义 为 p(E1H) 
与 pC EIS H) 的 比值 。 





_ p( EAH) 
LS- TRH (3.22) 


在 我 们 的 例子 中 ，LS 是 在 明天 下 雨 的 情况 下 ， 今 天 下 十 的 概率 ， 除 以 如 果 明 天 不 下 雨 ， 今 
天 下 雨 的 可 能 性 ， 











p(X Fis | HK FR RR) 
p( 今 天 下 雨 1 明 天 不 下 雨 ) 
LN 则 是 在 没有 论据 时 ,假设 五 不 被 信任 的 度量 ， 也 称 为 必要 性 似 然 值 ， 计 算 公 式 是 
-EIH 
he 
在 我 们 的 例子 中 ,LN 表示 在 明天 下 雨 的 情况 下 今天 不 下 十 的 概率 ， 除 以 如 果 明 天 不 下 雨 ， 
今天 不 下 雨 的 概率 ， 


LS= 








(3.23) 














p( 今 天 不 下 雨 | 明天 下 十 ) 
p 今天 不 下 南明 天 不 下 十 ) 
注意 ， 从 LS 的 计算 公式 不 能 推出 LY， 领域 专家 必须 分 别提 供 这 两 个 值 。 


LN = 
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领域 专家 如 何 确定 充分 性 似 然 值 和 必要 性 似 然 值 呢 ? 需要 他 们 处 理 条 件 概率 吗 

为 了 确定 LS 和 LN 的 值 ， 专 家 不 必 给 出 精确 的 条 件 概 率 值 ， 而 是 直接 确定 似 然 值 。LS 值 大 
(LS2) 就 表明 在 论据 存在 时 规则 强烈 支持 假设 ,LN 值 小 (0 <LN <1) 表明 在 论据 不 存在 时 规 
则 强烈 反对 假设 。 

由 于 从 LS 和 LN 的 似 然 值 可 以 轻易 地 算出 条 件 概率 ， 就 可 以 使 用 贝 叶 斯 规则 来 传送 论据 。 

现在 继续 看 伦敦 天 气 的 例子 。 规 则 1 说 明 ， 如 果 今 天 下 雨 ， 明 天 也 下 雨 的 可 能 性 就 很 大 (LS = 
2.5)。 即 使 今天 不 下 雨 ， 明 天 也 可 能 有 雨 (LN =0.6)。 

规则 2 则 考虑 了 不 下 雨 的 情况 。 如 果 今 天 不 下 雨 ， 明 天 也 很 有 可 能 不 下 雨 (LS =1.6) 。 
而 在 今天 下 十 的 情况 下 ， 明 天 下 雨 的 概率 要 高 于 在 今天 不 下 雨 的 情况 下 ， 明 天 也 不 下 雨 的 概 
率 。 为 什么 呢 ?LS 和 LN 的 值 通常 由 领域 专家 给 出 。 在 天 气 预报 的 例子 中 ，LS 和 LN 的 值 可 以 
由 气象 局 发 布 的 统计 信息 来 确认 。 规 则 2 也 给 出 了 在 今天 下 十 的 情况 下 明天 不 下 十 的 可 能 性 
(LN 20.4), 

专家 系统 怎样 得 到 明天 不 下 十 或 下 十 的 全 部 的 概率 

基于 规则 的 专家 系统 将 后 项 的 先 验 概率 pH) 转换 为 先 验 几 率 。 












































__ p(t) 
OCH) er (3.24) 


仅 在 第 一 次 调整 后 项 的 不 确定 性 时 ， 才 使 用 先 验 概率 。 为 了 计算 后 验 几 率 ， 当 规则 的 前 项 
( 即 论据 ) 为 真 时 ,使 用 LS 更 新 先 验 几率 。 当 规则 的 前 项 假 时 ,使 用 LN Cpr sca LAK 


O(HIE) LS x OCH) (3. 25) 
和 
OCHISE) LN x O(#) (3. 26) 
EHE FH SJ Ls PC Js s BLOSS - 
_ O(HIE) 
p(HIE) = 7+ OCHIE) (3. 27 ) 
和 
|. OCHIAE) 
p(HI 3E) "ICO(HIAE) (3. 28) 


用 伦敦 天 气 的 例子 解释 这 一 方法 的 用 法 。 假 设 用 户 指 出 今天 下 雨 ， 规 则 1 被 触发 ， 明 天 下 十 
的 先 验 概 率 转换 为 先 验 儿 率 : 
"TE M 
天 下 十 /二 = 
今天 下 十 的 论据 将 几率 增加 了 2.5 倍 ， 所 以 明天 下 十 的 概率 从 0. 5 增加 到 0. 71 : 
OCHR FISA TN) =2.5x1.0=2.5 
pCR FI SRA) = 
规则 2 也 被 触发 。 明 天 不 下 雨 的 先 验 概率 转换 为 先 验 几率 ,但 今天 下 雨 的 论据 将 几率 减 小 到 
0.4。 明 天 不 下 雨 的 概率 就 从 0.5 变 为 0. 29. 
LAS RR) — 0. 5 = 
0( 明 天 不 下 雨 ) = a= = 
0( 明 天 不 下 雨 | 今 天 下 雨 ) 20.4x1.020.4 


p( 明 天 不 下 雨 | 今天 下 雨 ) = 


1.0 





-0. 71 














1.0 











- 0. 29 
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结论 是 ， 如 条 今天 下 雨 ， 明 天 下 十 的 可 能 性 是 71% ， 不 下 十 的 可 能 性 是 29% 。 

如 果 用 户 输入 今天 不 下 雨 。 同 样 的 方式 可 计算 出 明天 不 下 雨 的 可 能 性 是 62% ， 下 十 的 可 能 
性 是 38% 。 

研究 了 论据 的 贝 叶 斯 规则 的 基本 原理 后 ， 我 们 可 以 向 专家 系统 中 添加 新 知识 。 首 先 我 们 需 
要 确定 天 气 发 生变 化 的 条 件 。 通 过 对 表 3. 3 中 的 数据 进行 分 析 ， 我们 建立 了 如 下 知识 库 (使 用 了 
专家 系统 框架 Leonardo) 。 

知识 库 

/* FORECAST: BAYESIAN ACCUMULATION OF EVIDENCE 




















control bayes 


Rule: 1 
if today is rain {LS 2.5 LN .6} 
then tomorrow is rain {prior .5} 


Rule: 2 
if today is dry {LS 1.6 LN .4} 
then tomorrow is dry {prior .5} 


Rule: 3 

if today is rain 

and rainfall is low {LS 10 LN 1} 
then tomorrow is dry {prior .5} 


Rule: 4 

if today is rain 

and rainfall is low 

and temperature is cold {LS 1.5 LN 1} 
then tomorrow is dry {prior .5} 


Rule: 5 

if today is dry 

and temperature is warm {LS 2 LN .9] 
then tomorrow is rain [prior .5) 

Rule: 6 

if today is dry 

and temperature is warm 

and sky is overcast {LS 5 LN 1} 

then tomorrow is rain [prior .5} 


/* The SEEK directive sets up the goal of the rule set 

seek tomorrow 

对 话 

根据 用 户 提 供 的 信息 ， 专 家 系统 判断 明天 是 否 不 下 雨 。 用 户 提 供 的 内 容 用 第 头 标 出 。 如 末 降 
雨量 少 于 4. 1mm， 则 为 低 降雨 量 。 如 末日 平均 气温 等 于 或 低 于 7.0%C， 则 认为 天 气 寒冷 ， 如 果 融 
于 7.0% ， 则 认为 天 气 暖和 。 如 果 日 照 时 间 低 于 4. 6hn， 则 认为 是 阴 天 。 


What is the weather today? 
= rain 











Rule: 1 
if today is rain (LS 2.5 LN .6] 
then tomorrow is rain {prior .5} 


0.5 


ro 19 





O(tomorrow is rain) — 


O(tomorrow is rain | today is rain) = 2.5 x 1.0 = 2.5 


2.5 


— 0.71 
1 工 十 2.9 





p(tomorrow is rain | today is rain) = 


tomorrow is rain {0.71} 
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-Rule: 2 
if today is dry {LS 1.6 LN .4} 
then tomorrow is dry [prior .5} 


0.5 


a er ae 





O(tomorrow is dry) 


O(tomorrow is dry | today is rain) = 0.4 x 1.0 = 0.4 


0.4 


1-04 due 





p(tomorrow is dry | today is rain) — 


tomorrow is rain {0.71} 
dry {0.29} 


What is the rainfall today? 
= low 


Rule: 3 

if today is rain 

and rainfall is low {LS 10 LN 1} 

then tomorrow is dry {prior .5} 
0.29 


O(tomorrow is dry) = 1-029" 0.41 


O(tomorrow is dry | today is rain rainfall is low) = 10 x 0.41—4.1 


a See 


p(tomorrow is dry | today is rain A rainfall is low) = 





tomorrow is dry {0.80} 
rain {0.71} 


What is the temperature today? 
= cold 


Rule: 4 

if today is rain 

and rainfall is low 

and temperature is cold {LS 1.5 LN 1} 
then tomorrow is dry {prior .5} 


0.80 


-1-o80 ? 


O(tomorrow is dry 


O(tomorrow is dry | today is rain rainfall is low N temperature is cold) 
—1.50x4-6 


p(tomorrow is dry | today is rain N rainfall is low N temperature is cold) 
6 

二 一 一 -二 0.86 

146 
tomorrow is dry {0.86} 

rain {0.71} 

Rule: 5 
if today is dry 
and temperature is warm {LS 2 LN .9} 
then tomorrow is rain {prior .5} 


0.71 
O(tomorrow is rain) = 1-071" 2.45 


O(tomorrow is rain | today is not dry N temperature is not warm) = 0.9 x 2.45 - 2.21 


p(tomorrow is rain | today is not dry N temperature is not warm) = 





tomorrow is dry {0.86} 
rain {0.69} 


What is the cloud cover today? 
= overcast 
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Rule: 6 

if today is dry 

and temperature is warm 

and sky is overcast {LS 5 LN 1} 
then tomorrow is rain {prior .5] 


Loo c9 


O(tomorrow is rain) = 





O(tomorrow is rain | today is not dry O temperature is not warm A sky is overcast) 
= 10 x 2.25 2.23 


p(tomorrow is rain | today is not dry N temperature is not warm sky is overcast) 
2.23 


93:224 997 


tomorrow is dry {0.86} 
rain {0.69} 
AMAAN “BRAN PRO. “HAR BR” d HB, 但 前 者 的 可 能 性 更 高 。 
从 表 3.3 可 以 看 出 专家 系统 仅 犯 过 4 次 错误 ， 成 功率 是 86% ， 比 同样 预测 伦敦 天 气 的 Naylor 











(1987) 结果 还 要 好 。 
3.5 贝 叶 斯 方法 的 偏差 


贝 叶 斯 推理 框 染 需要 概率 值 作为 初始 输入 。 对 这 些 值 的 估计 第 党 需要 人 的 评判 。 不 过 心理 


研究 表明 ， 人 给 出 的 概率 值 要 么 与 贝 叶 斯 规则 不 一 致 ， 要 么 做 得 很 粮 糕 (Burns and Pearl, 1981; 
Tversky and Kahneman ，1982 ) 。 这 说 明 条 件 概率 可 能 与 专家 提供 的 先 验 概 率 不 一 致 。 例 如 ， 一 辆 
汽车 不 能 启动 ， 在 按 下 启动 按钮 时 发 出 奇 低 的 噪声 。 如 果 汽 车 发 出 奇怪 的 噪声 ， 故 障 出 在 启动 按 
钮 上 的 条 件 概 率 可 表达 为 


IF the symptom is 'odd noises' 
THEN the starter is bad [with probability 0.7] 


而 如 果 汽 车 发 出 奇怪 的 噪声 ， 故 障 不 在 局 动 按 钮 上 的 条 件 概率 是 
p(starter is not badlodd noises) =p( starter is goodlodd noises) 21 -0.7 =0.3 


所 以 ,我 们 有 为 外 一 条 规则 


IF the symptom is ‘odd noises’ 
THEN the starter is good [with probability 0.3} 


领域 专家 在 处 理 条 件 概率 时 并 不 轻松 ,经常 否定 隐 含 概率 的 存在 (在 汽车 例子 中 隐 含 概率 











.3)。 








在 本 例 中 ， 通 过 可 用 的 统计 信息 和 经 验 学 习 ， 可 以 得 到 下 面 两 条 规则 : 


IF the starter is bad 
THEN the symptom is ‘odd noises’ {with probability 0.85} 


IF the starter is bad 
THEN the symptom is not ‘odd noises’ {with probability 0.15} 


要 使 用 贝 叶 斯 规则， 还 必须 有 先 验 概率 ， 即 当 汽 车 不 能 局 动 时 ， 局 动 按钮 有 故障 的 概率 。 这 





需要 专家 来 提供 。 假 设 专 家 认为 这 一 概率 是 5% ， 我 们 应 用 贝 叶 斯 规则 得 到 下 面 的 式 子 : 


. ; 0. 85 x 0. 05 
pl starter is bad | odd noises ) = 0. 85 x0. 05 +0. 15 x 0.95 - 0. 23 


这 个 值 远 低 于 最 初 由 专家 提供 的 估计 值 0.7。 
为 什么 会 不 一 致 ? BRB TW 
最 明显 的 原因 是 专家 在 估计 条 件 概 率 和 先 验 概 率 时 做 了 不 同 的 假设 。 我 们 试 着 从 后 验 概 率 p 











(starter is badlodd noises) 倒 推 先 验 概率 p( starter is bad) 。 在 本 例 中 ， 可 以 假设 


p(starter is good) =1 — p( starter is bad) 
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根据 公式 (3.18), ， 我 们 得 出 
p(H) = p(HIE) xp(EI-H) 
p(HIE) xp(EISH) +p(EIH)|1-p(HIE) | 
其 中 : 

p(H) = p(starter is bad); 

p(H E) = p(starter is bad | odd noises); 

p(E|H) = p(odd noises | starter is bad); 


p(E|-H) = p(odd noises | starter is good), 

如 果 我 们 使 用 专家 提供 的 p( starter is badl odd noises ) 的 值 0. 7 作为 正确 值 ，p ( starter is bad) 
的 先 验 概率 应 该 是 

pA) = eis sh Se OT 702 

这 个 值 几乎 是 专家 提供 的 值 5 和 8 6 fi, I ZW ZOSE 6 ds TEL SB REE RP E ET T AP Fn] 
的 估计 。 

事实 上 ， 由 专家 提供 的 和 完 验 概率 也 会 与 充分 性 似 然 伸 5、 必 要 性 似 然 值 LN Ai, BAA 
干 方法 处 理 这 一 问题 (Duda et al. , 1976), 最 常用 的 技术 是 分 段 线 性 插值 模型 (Duda et al. , 
1979) ， 首 次 应 用 在 PROSPECTOR 中 。 

要 使 用 贝 叶 斯 规则 ， 我 们 必须 满足 多 个 假定 条 件 ， 如 针对 假设 和 逆 假设 ， 论 据 间 都 应 是 条 件 
独立 的 。 由 于 很 少 有 实际 问题 满足 这 些 假 定 条 件 ， 使 用 贝 叶 斯 推理 的 系统 并 不 多 ， 用 于 矿产 惑 探 
的 专家 系统 PROSPECTOR 是 其 中 之 一 (Duda et al. , 1979), 











3.6 确信 因子 理论 和 基于 论据 的 推理 


确信 因子 理论 是 常用 的 蔡 代 贝 叶 斯 推理 的 方法 ， 这 一 理论 的 基本 原理 首次 出 现在 MYCIN 中 ， 
这 是 一 个 用 于 诊断 、 治 疗 传 染 性 血液 病 和 脑膜 炎 的 专家 系统 (Shortliffe and Buchanan, 1975). 
MYCIN 的 开发 者 发 现 ， 医 学 专家 通 各 用 既 不 符合 逻辑 一 致 性 或 数学 一 致 性 的 方式 表达 术语 的 可 
信和 度 。 此 外 ， 不 存在 问题 领域 相关 的 可 信赖 的 统计 数据 。 所 以 ，MYCIN 团队 不 能 使 用 传统 概率 
方法 。 于 是 ， 他 们 决定 用 确信 因子 (certainty factor, cf) 来 衡量 专家 对 术语 的 可 信和 度 。 确 信 因 子 
的 最 大 值 是 +1.0 ( 真 )， 最 小 值 是 -1.0 ( 假 )。 正 值 表示 可 信和 度 ， 负 值 表 示 不 可 信和 度 。 例 如 ， 
如 果 专 家 说 一 个 论据 几乎 是 真 的 ， 将 对 of 值 赋值 0.8。 表 3.4 是 MYCIN 系统 中 的 一 些 不 确定 性 
术语 (Durkin, 1994) , 


























A 3.4 不 确定 性 术语 及 其 解释 


术语 确信 因子 
Definitely not -1.0 
Almost certainly not -0.8 
Probably not -0.6 
Maybe not -0.4 
Unknown -0.2 ~ +0.2 
Maybe +0. 4 
Probably +0.6 
Almost certainly +0. 8 
Definitely +1.0 
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在 使 用 确信 因子 的 专家 系统 中 ， 知 识 库 中 规则 的 语法 是 : 
IF <evidence> 
THEN «hypothesis» {cf} 


其 中 ，of 是 论据 RAM i HB S f. 

可 信和 度 理论 基于 两 个 函数 : 可 信和 度 的 度量 MB (H, E), 不 可 信和 度 的 度量 MD (H, E) 
(Shortliffe and Buchanan, 1975) 。 这 两 个 函数 分 别 表示 在 论据 巨 出 现时 ， 假 设 万 的 可 信 度 的 增加 
程度 和 不 可 信和 度 的 增加 程度 。 

可 信和 度 和 不 可 信和 度 可 通过 先 验 概率 、 条 件 概率 计算 (Ng and Abramson, 1990) : 




















1 4a p(H) =1 
MB(H,E) = V maxLp( HIE) ,p( H) ] - p( H) as mi (3.29) 
max| 1,0] - p( H) 
1 在 p(H) =1 
MD(H,E) = | min[ p( HIE) ,p( H) ] - p( H) as mi (3.30) 
min| 1,0] - p( A) ` 





Hp, 

p( A) HB HON LY Jod EO ; 

p(H| E) 是 给 定论 据 已 时 假设 H WAAR, 

MB(H,E) All MD(H,E) BUB vi FERAT O0 ~ 1 之 间 。 假设 五 的 可 信和 度 和 不 可 信和 度 都 依赖 论 
据 的 类 型 。 有些 事实 可 能 会 提高 可 信和 度 , 而 有 些 事实 可 能 会 提高 不 可 信和 度 。 

如 何 确定 假设 的 可 信 度 和 不 可 信 度 的 总 体 情 况 

使 用 下 面 的 公式 将 可 信和 度 和 不 可 信和 度 红 合 为 一 个 数值 , 即 确信 因子 : 

MB(H,E) -MD(H,E) 
S =I min  MBCOH,E) .MD(H,E) | 

因此 ，cf 表达 了 假设 五 的 总 体 可 信和 度 ， 它 在 MYCIN 中 的 范围 是 -1~ +1。 
可 以 通过 一 个 例子 来 说 明 MYCIN 中 的 方法 。 考 虑 下 面 一 条 简单 的 规则 : 


IF A is X 
THEN Bis Y 


专家 通常 不 能 保证 这 个 规则 绝对 有 效 。 在 一 些 情况 下 ， 即 使 规则 的 TF 部 分 条 件 成 立 ， 
即 对 象 A 的 值 是 ， 对 象 B 也 可 能 有 不 同 的 Z 值 。 也 就 是 说 ， 我 们 讨论 的 是 准 统计 的 不 确 
«ETE, 

75A BUB X Br, AGES AX BN ARPS RU SB ESR A. Alt, RU KAR 
下 面 的 形式 : 

IF Ais X 


THEN Bis Y {cf 0.7}; 
B is Z {cf 0.2} 


另外 10% MH T 

这 个 规则 的 意思 是 ,假定 4 的 值 是 X， 则 B 取 Y 值 的 概率 是 70% ， 取 Z 值 的 概率 是 20% , 
取 其 他 值 的 概率 是 另外 10% 。 就 是 专家 保留 了 对 象 B 取 Y 了 和 ZZ 之 外 其 他 取 值 的 可 能 性 。 所 以 ， 
IR B OW T ZB. 

规则 中 的 确信 因子 通过 推理 链 来 传送 。 确 信 因 子 的 传送 还 包括 当 规 则 前 项 中 的 论据 不 确定 
时 ， 确 立 规则 后 项 的 净 确 信和 度 。 单 个 规则 前 项 的 准确 信和 度 of AH, E), ， 可 以 由 规则 前 项 的 确信 因 
T cf (FE) 来 以 规则 的 确信 因子 of 得 到 

cf( H,E) =cf(E) xef (3. 32) 















































GD 











例如 ， 
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IF the sky is clear 
THEN the forecast is sunny {cf 0.8} 


“sky is clear" 的 当前 确信 因子 是 0.$5， 那 么 

cf( H,E) =0.5 x0.8 =0.4 
按照 表 3.4， 这 个 结 采 意味 者 “可 能 晴天 ”。 
对 于 有 多 个 前 项 的 规则 ， 专 家 系统 如 何 计算 确信 因子 
对 于 合 取 规则 ， 例 如 : 


IF «evidence E] > 
AND <evidence E> > 





AND <evidence E,» 
THEN «hypothesis H > {cf} 


后 项 的 净 确信 和 度 ， 即 假设 Hoff fes ALR shit 
cf( H,E, QEN XE) = min| cf( E, ) CE) ee GE s] x of i»: 33) 
例如 ， 


IF sky is clear 
AND the forecast is sunny 
THEN the action is ‘wear sunglasses’ {cf 0.8} 


“sky is clear" 的 确信 和 度 是 0.9,“the forecast is sunny” 的 确信 和 度 是 0.7， 那 么 
cf( H, E, QE,) =min|0.9,0.7] x0. 8 =0.7 x0. 8 =0. 56 

根据 表 3.4， 结 论 可 以 解释 为 “或 许 今 天 适合 戴 太阳 锐 ”。 

对 于 析 取 规则 ， 如 


IF <evidence E] > 
OR «evidence E> > 
OR «evidence En > 


THEN «hypothesis H> {cf} 
假设 HA Wits Eat PT 


of(H,E, UE,U---UE,) =max| f E,) ,f(E,) ,---,d (E, )] xo (3. 34) 
例如 ， 
IF sky is overcast 
OR the forecast is rain 


THEN the action is ‘take an umbrella’ (cf 0.9) 
"sky is overcast” 的 确信 度 是 0.6, “forecast is rain” 的 确信 和 度 是 0.8， 则 
cf( H,E, UE,) 2 max[0.6,0.8| x0.9 20.8 x0.9 20. 72 
结论 可 解释 为 “今天 几乎 肯定 是 要 带 上 雨伞 ”。 
有 时 两 个 或 更 多 的 规则 会 影响 到 同一 个 假设 ， 这 种 情况 下 专家 系统 怎么 办 
当 同 一 个 结论 要 由 两 个 或 多 个 规则 共同 推出 时 ， 必 须 合 并 它们 的 确信 因子 ， 以 得 出 假设 的 
确信 因子 。 假 设 知 识 库 中 有 如 下 规则 : 


Rule 1: IF A is X 
THEN Cis Z (cf 0.8) 











Rule2: IF Bis Y 
THEN C is Z (cf 0.6) 


如 有 果 规 则 1 和 规则 2 都 被 触发 了 ， 对象 C 取 Z 值 的 确信 和 度 如 何 计算 ? FRR IR, WR AKA 
不 同 来 源 (规则 1 和 规则 2) 的 两 个 论据 (4iX 和 Bis 六 ， 都 文 持 同 一 个 假设 (Cis Z), 假设 
的 可 信 度 应 该 提高 ， 应 该 比 只 有 一 个 论据 时 更 强 。 

我 们 使 用 下 面 的 公式 来 计算 结合 后 的 确信 因子 (Durkin, 1994) : 
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cf, +o, x (1- ofi) fi of, >0 , of, >0 
cf, +o, 

1 — min| Icf, |, lof, l] 

cf +cfp x(1+cf) ef, <0 RE cf, <0 





oC did) Ti cf, «0 或 者 of, <0 (3. 35) 


) 
T 


cf 是 规则 1 HME A KIMA E; 
cf, FEA 2 对 假设 五 的 确信 度 ，; 
lof, 和 | of, | 分 别 是 cf 和 cf 的 绝对 值 。 
因此 ， 我 们 假设 
cf( E,) =cf(E,) 21.0 
由 公式 (3.32) 可 得 
cf, (H,E,) =cf(E,) xcf, 21.0 x0.8 20.8 
cf,(H,E,) =cf(E,) xcf, 21.0x0.6 20.6 
由 公式 (3.35) 可 得 
ff, of, ) =f, CH,E,) €; CH,E,) x LY -of CH,E,) | 
20.840.6 x(1-0.8) 20.92 
这 个 例子 表明 假设 的 可 信 度 增加 ， 也 验证 了 我 们 的 预期 。 
接 下 来 考虑 规则 的 确信 因子 是 负 值 的 情况 。 假 设 
cf( E,) =1, f(E,) = -1.0 
那么 
cf, (H,E,) 21.0x0.8 =0.8 
cf,(H,E,) = -1.0x0.6 = -0.6 
由 公式 (3.35) 可 得 
cf, (H,E,) +cf,(H,E, 8-0. 
该 例 说 明了 当 一 条 规则 支持 假设 而 男 一 条 规则 反对 假设 的 情况 下 ， 如 何 计算 确信 因子 ， 即 
兆 可 信和 度 。 
如 果 规 则 的 确信 因子 都 是 负 值 呢 ? 假设 
cf( E,) 2cf( Ej) = -1.0 


=0.5 


那么 
cf, (H,E,) = -1.0x0.8 = -0.8 
cf,(H,E,) = -1.0x0.6 = -0.6 
由 公式 (3.35) 可 得 . 
ff, .f.) =f CH,E,) €; CH,E,) x LY e fh CH,E,) ] 
= -0.8-0.6x(1-0.8) = -0.92 
这 个 例子 中 假设 的 不 可 信和 度 有 了 增加 。 
确信 因子 理论 是 贝 叶 斯 推理 的 实用 的 替代 方法 。 合 并 确信 因子 的 启发 式 方法 不 同 于 合并 概 
率 的 方法 。 确 定理 论 不 是 “纯粹 数学 ”的 方法 ， 而 是 模拟 人 类 专家 思考 过 程 的 方法 。 
下 面 通过 3. 4 市 介绍 的 专家 系统 FORECAST， 来 说 明基 于 论据 的 推理 以 及 确信 因子 在 一 组 规 
则 中 传送 的 方法 。 
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3.7 FORECAST， 确信 因子 的 应 用 


这 个 专家 系统 的 任务 是 预测 明天 是 否 下 雨 ， 即 为 多 值 对 象 tomorrow 建立 确信 因子 。 为 了 简化 
任务 ， 我 们 仍 使 用 3.4 节 的 相关 规则 。 

知识 库 

/* FORECAST: AN APPLICATION OF CERTAINTY FACTORS 





control cf 
control ‘threshold 0.01’ 


Rule: 1 
if today is rain 
then tomorrow is rain {cf 0.5} 


Rule: 2 
if today is dry 
then tomorrow is dry {cf 0.5} 


Rule: 3 

if today is rain 

and rainfall is low | 
then tomorrow is dry {cf 0.6} 


if today is rain 

and rainfall is low 

and temperature is cold 
then tomorrow is dry (cf 0.7] 


if today is dry 
and temperature is warm 
then tomorrow is rain [cf 0.65] 


Rule: 6 

if today is dry 

and temperature is warm 

and sky is overcast 

then tomorrow is rain {cf 0.55} 


seek tomorrow 

对 话 

为 了 应 用 基于 确信 因子 的 不 精确 推理 技术 ， 专 家 系统 让 用 户 既 输入 对 象 的 什 ， 又 输入 与 值 
关联 的 确信 和 度 。 例 如 ， 如 果 使 用 Leonardo 规定 的 0 ~ 1 的 范围 ， 可 能 会 出 现下 面 的 对 话 : 


What is the weather today? 
=> rain 








Rule: 1 
if today is rain 
then tomorrow is rain {cf 0.5} 


cf (tomorrow is rain, today is rain) = cf (today is rain) x cf = 1.0 x 0.5 =0.5 
tomorrow is rain {0.50} 

What is the rainfall today? 

=> low 


To what degree do you believe the rainfall is low? Enter a numeric certainty 
between 0 and 1.0 inclusive. 
— 0.8 


Rule: 3 

if today is rain 

and rainfall is low 

then tomorrow is dry (cf 0.6) 
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cf (tomorrow is dry, today is rain N rainfall is low) 
= min [cf (today is rain), cf (rainfall is low)] x cf = min (1,0.8| x 0.6 = 0.48 


tomorrow is rain {0.50} 
dry {0.48} 


What is the temperature today? 
= cold 


To what degree do you believe the temperature is cold? Enter a numeric certainty 
between O and 1.0 inclusive. 
=> 0.9 


Rule: 4 

if today is rain 

and rainfall is low 

and temperature is cold 
then tomorrow is dry (cf 0.7] 


cf (tomorrow is dry, today is rain N rainfall is low n temperature is cold) 
= min |cf (today is rain), cf (rainfall is low), cf (temperature is cold)| x cf 
= min |1,0.8,0.9] x 0.7 = 0.56 


tomorrow is dry {0.56} 
rain {0.50} 


Cf (Cfrute:3, CfRule:4) = CfRule:3 + CfRule:4 X (1 — CfRule:3) 
= 0.48 + 0.56 x (1 — 0.48) = 0.77 


tomorrow is dry 10.77] 
rain {0.50} 


3.8 贝 叶 斯 推理 和 确信 因子 的 对 比 

在 上 一 站 ， 我 们 介绍 了 专家 系统 中 的 两 个 流行 的 不 确定 性 管理 技术 。 现 在 我 们 比较 这 两 个 
技术 ， 分 析 它 们 都 适合 哪些 问题 。 

概率 理论 是 处 理 不 精确 知识 和 随机 数据 的 最 古老 、 最 好 的 技术 ， 很 适用 于 预测 和 计划 相关 
的 问题 ， 因 为 可 以 获得 统计 数据 ， 并 编写 准确 的 概率 语句 。 

专家 系统 PROSPECTOR 是 一 个 帮助 勘探 地 质 学 家 搜寻 矿床 的 专家 系统 ， 它 使 用 了 贝 叶 斯 技 
术 。 这 个 专家 系统 开发 得 很 成 功 ， 如 通过 使 用 地 质 、 地 球 物理 、 地 球 化 学 数据 ，PROSPECTOR 
预测 出 了 华盛顿 州 Tolman 山 附 近 的 一 个 钼 矿床 (Campbell et al. , 1982) PROSPECTOR 团队 能 
利用 已 知 矿 床 的 有 效 数 据 和 统计 信息 ， 也 定义 了 每 一 个 事件 的 概率 。PROSPECTOR 团队 也 假定 
了 论据 之 间 有 具有 人 条件 独立 性 ， 这 也 是 使 用 贝 叶 斯 规则 的 前 提 。 

但 是 ,在 许多 应 用 领域 , 并 不 总 能 得 到 可 用 的 统计 信息 ,或 总 能 假定 论据 间 满 足 条 件 独 立 
性 。 所 以 ,许多 研究 者 发 现 贝 叶 斯 方法 对 他 们 的 工作 并 不 适合 。 例 如 ,在 MYCIN 中 ， 由 于 医学 
领域 通常 不 提供 需要 的 数据 ，Shortliffe 和 Buchanan 整 不 能 使 用 传统 的 概率 方法 (Shortliffe and 
Buchanan, 1975), 

尽管 确信 因子 方法 缺乏 概率 论 那样 的 数学 正确 性 ,在 一 些 领域 如 在 诊断 领域 、 尤 其 是 医 
药 领 域 ， 它 还 是 能 够 胜 过 贝 叶 斯 推理 方法 的 。 在 像 MYCIN 这 样 的 诊断 专家 系统 中 ， 专 家 根据 
目 己 的 知识 或 下 觉 判 断 来 确定 规则 和 确信 因子 。 在 概率 未 知 、 或 难以 获取 或 代价 后 贵 的 场合 ， 
可 以 使 用 确信 因子 。 论 据 推理 机 制 可 以 增 量 管理 获得 的 论据 、 合 取 式 假设 、 析 取 式 假设 ， 以 
及 可 信 度 不 同 的 论据 。 为 外 ， 确 信 因 子 方 法 对 基于 规则 的 专家 系统 中 的 控制 流 能 提供 更 好 的 
解释 。 

贝 叶 斯 方法 和 确信 因子 虽 彼 此 不 同 ， 它们 却 有 着 共 同 问 题 ， 找到 能 够 量化 个 人 的 、 主 观 的 、 
定性 的 信息 的 专家 。 人 类 很 容易 有 仿 差 .所 以 选择 哪 一 个 不 确定 性 管理 技术 很 大 程度 上 依赖 于 
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现 有 的 领域 专家 。 

当 存 在 可 靠 的 统计 数据 ， 知 识 工 程 师 能 够 主持 大 局 ， 也 有 能 参与 严密 的 决策 分 析 对 话 的 专 
家 时 ， 贝 叶 斯 方法 应 该 是 最 适合 的 。 这 3 个 条 件 缺 少 任 何 一 个 ， 使 用 贝 叶 斯 方法 就 显得 太 武断 ， 
也 会 由 于 但 差 而 不 能 得 到 有 价值 的 结果 。 还 需 提 及 的 是 ， 贝 叶 斯 信念 传播 的 复杂 度 是 指数 级 的 ， 
不 适用 于 大 型 知识 库 。 

虽然 缺乏 形式 基础 ， 但 是 确信 因子 技术 为 专家 系统 处 理 不 确定 性 提供 了 一 个 简单 的 方法 ， 
在 许多 应 用 中 的 结果 也 都 是 可 以 接受 的 。 


3.9 小 结 

本 章 介 绍 了 用 于 专家 系统 的 两 个 不 确定 性 管理 技术 : 贝 叶 斯 推理 和 确信 因子 。 分 析 了 不 确定 知 
识 的 主要 来 源 ， 简 要 回顾 了 概率 理论 。 我 们 讨论 了 可 累积 论据 的 贝 叶 斯 方法 ， 并 基于 贝 叶 斯 方法 开 
发 了 一 个 简单 的 专家 系统 。 之 后 介绍 了 确信 因子 理论 〈( 贝 叶 斯 推理 的 常用 替代 方法 ) ， 并 基于 论据 
推理 构建 了 一 个 专家 系统 。 最 后 ， 将 贝 叶 斯 推理 和 确信 因子 进行 了 对 比 ， 分 析 了 它们 的 适用 范围 。 

本 章 的 主要 内 容 如 下 : 

e 不 确定 性 是 由 于 缺乏 帮助 我 们 得 出 完美 可 靠 结 论 的 精确 知识 。 专 家 系统 中 的 不 确定 知识 
的 主要 来 源 是 : 弱 上 暗示、 不 精确 的 语言 、 数 据 缺 失 、 丝 合 不 同 专家 的 观点 。 

e 概率 理论 为 专家 系统 中 的 不 确定 性 管理 提供 了 一 个 精确 的 、 数 学 校正 的 方法 。 在 给 定论 
据 的 前 提 下 ， 我 们 可 使 用 贝 叶 斯 规则 计算 出 一 个 假设 的 概率 。 

e 用 于 矿床 勘探 的 专家 系统 PROSPECTOR 是 第 一 个 成 功 应 用 贝 叶 斯 规则 传送 不 确定 性 的 
系统 。 

e 要 使 用 贝 叶 斯 方法 ， 专 家 需要 提供 假设 五 的 先 验 概率 、 充 分 性 似 然 值 LS (衡量 在 给 定论 
据 时 假设 的 可 信和 度 )、 必 要 性 似 然 值 (衡量 在 给 定论 据 E 时 假设 的 不 可 信和 度 )。 贝 叶 斯 
方法 使 用 下 面 的 规则 形式 : 

IF E is true {LS, LN} 

THEN His true {prior probability} 

e 要 想 使 用 贝 叶 斯 方法 ， 论 据 间 必须 满足 条 件 独 立 ， 还 应 该 有 可 靠 的 统计 数据 ， 并 为 每 个 
假设 定义 先 验 概率 。 在 实际 问题 上 ， 往往 不 能 满足 这 些 要 求 ， 所 以 只 有 少数 系统 可 以 使 
用 贝 叶 斯 推理 。 

e 确信 因子 理论 是 贝 叶 斯 方法 的 常用 替代 方法 。 这 一 理论 的 基本 原理 首次 出 现在 诊断 医疗 
专家 系统 MYCIN 中 。 

e 确信 因子 理论 为 专家 系统 中 的 不 确定 管理 提供 了 一 个 判断 方法 。 使 用 这 一 方法 时 ， 需 要 
专家 提供 确信 因子 of 的 值 ， 用 来 表示 给 定论 据 时 假设 五 的 可 信和 度 水 平 。 确 信和 因子 方法 
使 用 如 下 规则 : 


IF E is true 
THEN His true {cf} 


e 当 概 率 未 知 或 不 多 获得 时 ， 会 使 用 确信 因 了 于 。 确 定理 论 可 以 增 量 获得 的 管理 论据 、 合 取 
式 假设 、 析 取 式 假设 ， 以 及 具有 不 同 可 信和 度 的 论据 。 
e 贝 叶 斯 推理 和 确定 理论 面临 的 共同 问题 是 : 需要 一 个 能 够 量化 主观 信息 和 定性 信息 的 专家 。 










































































复习 题 


l. 什么 是 不 确定 性 ?” 什么 情况 下 知识 可 以 不 精确 ， 数 据 可 以 不 完整 、 不 一 致 ? 举例 说 明 不 精确 
的 知识 。 
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2. 什么 是 概率 ? 用 数学 方式 描述 在 事件 B 发 生 时 事件 4 发生 的 条 件 概 率 。 什 么 是 贝 叶 斯 
规则 ? 

3. 什么 是 贝 叶 斯 推理 ? 专家 系统 怎样 对 可 能 的 真 假设 进行 排序 ? 举例 说 明 。 

4. 为 什么 PROSPECTOR 团队 能 够 将 贝 叶 斯 方法 作为 不 确定 性 管理 技术 ? 使 用 贝 叶 斯 推理 必须 要 

具备 哪些 条 件 ? 

什么 是 充分 性 似 然 值 和 必要 性 似 然 值 ? 专家 如 何 确定 LS I LN 的 值 ? 

什么 是 先 验 概率 ? 举例 说 明基 于 贝 叶 斯 推理 的 专家 系统 的 规则 表达 方式 。 

基于 规则 的 专家 系统 如 何 使 用 贝 叶 斯 方法 传送 不 确定 性 ? 

条 件 概 率 为 什么 也 许 会 与 专家 提供 的 先 验 概 率 不 一 致 ? 举例 说 明 。 

为 什么 确信 因子 理论 可 被 看 做 贝 叶 斯 推理 的 实用 替代 方法 ” 什么 是 可 信和 度 和 不 可 信和 度 的 度量 ? 

定义 一 个 确信 因子 。 

10. 专家 系统 如 何 确定 “与 ” “或 ”规则 的 将 确 定性 ” 举例 说 明 。 

11. 专家 系统 如 何 合并 影响 同一 个 假设 的 多 个 规则 的 确信 因子 ?举例 说 明 。 

E 它们 分 别 适合 什么 样 的 应 用 场景 ? 为 什么 ? 这 两 个 方法 的 共 
同 问题 是 什么 
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